Blog, publications récentes

Le futur de l’orchestration de workflows dans Hadoop: Oozie 5.x

Au DataWorks Summit Europe 2018 de Berlin, j’ai eu l’occasion d’assister a une session sur Apache Oozie. La présentation se concentre sur les caractéristiques du prochain Oozie 5.0 et celles à venir dans la branche 5.X. Elle détaille ainsi le Workflow Scheduler d’Apache Ambari et son utilisation pour créer et visualiser des workflows Apache Oozie. [...]

Par |2018-06-05T22:36:38+00:00May 23rd, 2018|Big Data, DataWorks Summit 2018|1 Comment

Questions essentielles sur les base de données Time Series

Aujourd’hui, le gros des données Big Data est de nature temporelle. On le constate dans les médias comme chez nos clients : compteurs intelligents, transactions bancaires, usines intelligentes, véhicules connectés… IoT et Big Data font bon ménage. […]

Par |2018-06-05T22:36:40+00:00March 19th, 2018|Big Data, Data Engineering|3 Commentaires

Ambari – Comment utiliser les blueprints

En tant qu'ingénieurs d'infrastructure chez Adaltas, nous déployons des clusters. Beaucoup de clusters. Généralement, nos clients choisissent d'utiliser une distribution telle que HDP ou CDH, qui viennent avec leurs solutions de déploiement: Ambari et Cloudera Manager respectivement. Ces outils permettent de déployer des clusters facilement depuis leurs interfaces simples et bien documentées. Bien que pratique [...]

Par |2018-06-05T22:36:41+00:00January 17th, 2018|Big Data|0 commentaire

Notes sur Katacoda relatives à l’orchestrateur de conteneur Kubernetes

Il y a quelques semaines, j’ai consacré deux jours pour suivre les cours relatifs à la solution d’orchestation de *container Kubernetes mise à disposition sur la plateforme Katacoda. Je partage ces notes qui, à l’usage, me servent de pense bête. […]

Par |2018-06-05T22:36:42+00:00January 8th, 2018|Conteneur|0 commentaire

Open Source Summit 2017 – une semaine à Pragues

L'équipe Adaltas s'est rendu au complet à la conférence Open Source Summit 2017 ainsi qu'à la MesosConf 2017 qui ont eu lieu à Pragues il y a maintenant 3 semaines. A cette occasion, nous avons compilé une série d'articles sur les conférences qui nous ont les plus marquées. Pendant les 3 premiers jours, durant [...]

Par |2018-06-05T22:36:42+00:00November 23rd, 2017|Évènements|0 commentaire

Passage à l’échelle de larges pipelines de données en temps réel avec Go

La semaine dernière, à l’ Open Source Summit à Prague, Jean de Klerk a tenu une conférence intitulée “Passage à l’échelle en temps réel de pipelines de données avec Go”. Cet article passe en revue les principaux points de l’exposé, en détaillant les étapes que Jean a franchies en optimisant [...]

Par |2018-06-05T22:36:45+00:00November 21st, 2017|Open Source Summit Europe 2017|0 commentaire

Personne* ne met Java dans un containeur

Cette discussion porte sur les problèmes de mettre Java dans un conteneur et comment, dans sa dernière version 9, le JDK est maintenant plus conscient du conteneur dans lequel il s’exécute. La présentation est dirigée par Joerg Schad, ingénieur logiciels distribués de Mesosphere, à l’OpenSource Summit 2017 de Prague. […]