Loading...
Accueil2018-10-14T11:26:56+00:00

Big Data

Data Engineering

Chaîne d’alimentation, préparation de la  donnée, data lake, data gouvernance

Data Science

Écriture d’algorithmes, Spark, machine learning, exploration, statistiques, python, R

Data Streaming

Bus de messages, indicateur clef de performance (ICP), détection de seuil, requêtes sur fenêtre de temps, comportements intelligents

DataViz

Visualisation, notebooks

Dernières Publications

Omid : Traitement de transactions scalables et hautement disponibles pour Apache Phoenix

By |May 24th, 2018|Categories: Big Data, DataWorks Summit 2018, Évènements|Tags: , , , , , |

Apache Omid fournit une couche transactionnelle au-dessus des bases de données clés / valeurs NoSQL. […]

Apache Beam : un modèle de programmation unifié pour les pipelines de traitement de données

By |May 24th, 2018|Categories: Data Engineering, DataWorks Summit 2018, Évènements|Tags: , , , , , , , , |

Dans cet article, nous allons passer en revue les concepts, l’histoire et le futur d’Apache Beam, qui pourrait bien devenir le nouveau standard pour la définition des pipelines de traitement de données. […]

Le futur de l’orchestration de workflows dans Hadoop: Oozie 5.x

By |May 23rd, 2018|Categories: Big Data, DataWorks Summit 2018|Tags: , |

Au DataWorks Summit Europe 2018 de Berlin, j’ai eu l’occasion d’assister a une session sur Apache Oozie. La présentation se concentre sur les caractéristiques du prochain Oozie 5.0 et celles à venir dans la branche [...]

Quelles nouveautés pour Apache Spark 2.3 ?

By |May 23rd, 2018|Categories: Data Engineering, Data Science, DataWorks Summit 2018|Tags: , , , , , , , , |

Plongeons nous dans les nouveautés proposées par la nouvelle distribution 2.3 d’Apache Spark. […]

Questions essentielles sur les base de données Time Series

By |March 19th, 2018|Categories: Big Data, Data Engineering|Tags: , , , , , |

Aujourd’hui, le gros des données Big Data est de nature temporelle. On le constate dans les médias comme chez nos clients : compteurs intelligents, transactions bancaires, usines intelligentes, véhicules connectés… IoT et Big Data font [...]

Ambari – Comment utiliser les blueprints

By |January 17th, 2018|Categories: Big Data|Tags: , , , |

En tant qu'ingénieurs d'infrastructure chez Adaltas, nous déployons des clusters. Beaucoup de clusters. Généralement, nos clients choisissent d'utiliser une distribution telle que HDP ou CDH, qui viennent avec leurs solutions de déploiement: Ambari et Cloudera [...]

Notes sur Katacoda relatives à l’orchestrateur de conteneur Kubernetes

By |January 8th, 2018|Categories: Conteneur|

Il y a quelques semaines, j’ai consacré deux jours pour suivre les cours relatifs à la solution d’orchestation de *container Kubernetes mise à disposition sur la plateforme Katacoda. Je partage ces notes qui, à l’usage, [...]