Loading...
Accueil2018-11-05T13:37:49+00:00

Big Data

Data Engineering

Chaîne d’alimentation, préparation de la  donnée, Data Lake, gouvernance des données

Data Science

Écriture d’algorithmes, Spark, Machine Learning, exploration, statistiques, Python, R

Data Streaming

Bus de messages, indicateur clef de performance (ICP), détection de seuil, requêtes sur fenêtre de temps, comportements intelligents

DataViz

Visualisation, Notebooks

Dernières Publications

Publier Spark SQL Dataframe et RDD avec Spark Thrift Server

By |March 25th, 2019|Categories: Big Data, Data Engineering|Tags: , , , , |

La nature distribuée et en-mémoire du moteur de traitement Spark en fait un excellant candidat pour exposer des données à des clients qui souhaitent des latences faibles. Les dashboards, les notebooks, les studios de BI, [...]

Multihoming sur Hadoop

By |March 5th, 2019|Categories: Adalas Summit 2018, Big Data, Data Engineering|Tags: , , |

Le multihoming, qui implique l’association de plusieurs réseaux à un nœud, permet de gérer l’utilisation de réseaux hétérogènes dans un cluster Hadoop. Cet article est une introduction au concept de multihoming et à ses applications [...]

Introduction à Cloudera Data Science Workbench

By |February 28th, 2019|Categories: Big Data, Data Engineering, Data Science, Machine learning|Tags: , , , , , |

Cloudera Data Science Workbench est une plateforme qui permet aux Data Scientists de créer, gérer, exécuter et planifier des workflows de Data Science à partir de leur navigateur. Cela leur permet ainsi de se concentrer [...]

Apache Knox, c’est facile !

By |February 4th, 2019|Categories: Adalas Summit 2018, Big Data, Cyber security, Data Gouvernance|Tags: , , , , , , , , |

Apache Knox est le point d’entrée sécurisé d’un cluster Hadoop, mais peut-il être également le point d’entrée de mes applications REST ? […]

Installation de Kubernetes sur CentOS 7

By |January 29th, 2019|Categories: Adalas Summit 2018, Conteneur, DevOps, Uncategorized|Tags: , , , |

Cet article présente la démarche à suivre afin d’installer un cluster Kubernetes. Chaque étape sera détaillée afin que ayez une compréhension approfondie de chacune d’elle. […]

Apprentissage par renforcement appliqué au jeu de Poker

By |January 9th, 2019|Categories: Data Science, Deep Learning|Tags: |

Dans cet article, nous présenterons le "Deep Reinforcement Learning", et plus particulièrement l'algorithme de Deep Q Learning introduit par DeepMind il y a quelques années. Dans une seconde partie, nous implémenterons cet algorithme pour essayer [...]

Surveillance d’un cluster Hadoop de production avec Kubernetes

By |December 21st, 2018|Categories: Conteneur, Data Engineering, DevOps|Tags: , , , , , , , |

La surveillance d’un cluster Hadoop de production est un vrai challenge et se doit d’être en constante évolution. Aujourd’hui, la solution que nous utilisons se base sur Nagios. Efficace en ce qui concerne la surveillance [...]