Loading...
Accueil 2017-11-14T16:07:54+00:00

Big Data

Data Engineering

Chaîne d’alimentation, préparation de la  donnée, data lake, data gouvernance

Data Science

Écriture d’algorithmes, Spark, machine learning, exploration, statistiques, python, R

Data Streaming

Bus de messages, indicateur clef de performance (ICP), détection de seuil, requêtes sur fenêtre de temps, comportements intelligents

DataViz

Visualisation, notebooks

Dernières Publications

Le futur de l’orchestration de workflows dans Hadoop: Oozie 5.x

By | May 23rd, 2018|Categories: Big Data, DataWorks Summit 2018|Tags: , |

Au DataWorks Summit Europe 2018 de Berlin, j’ai eu l’occasion d’assister a une session sur le Workflow Scheduler d’Apache Ambari et son utilisation pour créer et visualiser des workflows Apache Oozie. La conférence était donnée [...]

Quelles nouveautés pour Apache Spark 2.3 ?

By | May 23rd, 2018|Categories: Data Engineering, Data Science, DataWorks Summit 2018|Tags: , , , , , , , , |

Plongeons nous dans les nouveautés proposées par la nouvelle distribution 2.3 d’Apache Spark. […]

Questions essentielles sur les base de données Time Series

By | March 19th, 2018|Categories: Big Data, Data Engineering|Tags: , , , , , |

Aujourd’hui, le gros des données Big Data est de nature temporelle. On le constate dans les médias comme chez nos clients : compteurs intelligents, transactions bancaires, usines intelligentes, véhicules connectés… IoT et Big Data font [...]

Ambari – Comment utiliser les blueprints

By | January 17th, 2018|Categories: Big Data|Tags: , , , |

En tant qu'ingénieurs d'infrastructure chez Adaltas, nous déployons des clusters. Beaucoup de clusters. Généralement, nos clients choisissent d'utiliser une distribution telle que HDP ou CDH, qui viennent avec leurs solutions de déploiement: Ambari et Cloudera [...]

Notes sur Katacoda relatives à l’orchestrateur de conteneur Kubernetes

By | January 8th, 2018|Categories: Conteneur|

Il y a quelques semaines, j’ai consacré deux jours pour suivre les cours relatifs à la solution d’orchestation de *container Kubernetes mise à disposition sur la plateforme Katacoda. Je partage ces notes qui, à l’usage, [...]

Passage à l’échelle de larges pipelines de données en temps réel avec Go

By | November 21st, 2017|Categories: Open Source Summit Europe 2017|Tags: , , , , , , , |

La semaine dernière, à l’ Open Source Summit à Prague, Jean de Klerk a tenu une conférence intitulée “Passage à l’échelle en temps réel de pipelines de données avec Go”. [...]