Loading...
Accueil2018-11-05T13:37:49+00:00

Big Data

Data Engineering

Chaîne d’alimentation, préparation de la  donnée, Data Lake, gouvernance des données

Data Science

Écriture d’algorithmes, Spark, Machine Learning, exploration, statistiques, Python, R

Data Streaming

Bus de messages, indicateur clef de performance (ICP), détection de seuil, requêtes sur fenêtre de temps, comportements intelligents

DataViz

Visualisation, Notebooks

Dernières Publications

Spark Streaming partie 1: construction de data pipelines avec Spark Structured Streaming

By |April 18th, 2019|Categories: Big Data, Data Engineering|Tags: , , , , |

Spark Structured Streaming est un nouveau moteur de traitement stream introduit avec Apache Spark 2. Il est construit sur le moteur Spark SQL et utilise le modèle Spark DataFrame. Le moteur Structured Streaming partage la [...]

Publier Spark SQL Dataframe et RDD avec Spark Thrift Server

By |March 25th, 2019|Categories: Big Data, Data Engineering|Tags: , , , , |

La nature distribuée et en-mémoire du moteur de traitement Spark en fait un excellant candidat pour exposer des données à des clients qui souhaitent des latences faibles. Les dashboards, les notebooks, les studios de BI, [...]

Multihoming sur Hadoop

By |March 5th, 2019|Categories: Adalas Summit 2018, Big Data, Data Engineering|Tags: , , |

Le multihoming, qui implique l’association de plusieurs réseaux à un nœud, permet de gérer l’utilisation de réseaux hétérogènes dans un cluster Hadoop. Cet article est une introduction au concept de multihoming et à ses applications [...]

Introduction à Cloudera Data Science Workbench

By |February 28th, 2019|Categories: Big Data, Data Engineering, Data Science, Machine learning|Tags: , , , , , |

Cloudera Data Science Workbench est une plateforme qui permet aux Data Scientists de créer, gérer, exécuter et planifier des workflows de Data Science à partir de leur navigateur. Cela leur permet ainsi de se concentrer [...]

Apache Knox, c’est facile !

By |February 4th, 2019|Categories: Adalas Summit 2018, Big Data, Cyber security, Data Gouvernance|Tags: , , , , , , , , |

Apache Knox est le point d’entrée sécurisé d’un cluster Hadoop, mais peut-il être également le point d’entrée de mes applications REST ? […]

Installation de Kubernetes sur CentOS 7

By |January 29th, 2019|Categories: Adalas Summit 2018, Conteneur, DevOps|Tags: , , , |

Cet article présente la démarche à suivre afin d’installer un cluster Kubernetes. Chaque étape sera détaillée afin que ayez une compréhension approfondie de chacune d’elle. […]