cesar

About César Berezowski

Consultant Big Data @ Adaltas depuis 2015, César aime découvrir de nouvelles choses et expérimenter avec les nouvelles technologies en plus de son métier de tous les jours

Intégration continue et “gating” multi-repo à grand échelle

Cet article est un récapitulatif avec nos impressions de la présentation de l’outil d’intégration continue d’OpenStack “Zuul” à la conférence OpenSource Summit 2017 à Prague par Monty Taylor (à ne pas confondre avec le projet Zuul de Netflix) […]

By | 2017-11-23T11:17:50+00:00 October 28th, 2017|Open Source Summit Europe 2017|0 Comments

Changer la couleur de la topbar d’Ambari

J'étais récemment chez un client qui a plusieurs environnements (Prod, Integration, Recette, ...) sur HDP avec chacun son instance Ambari. L'une des questions soulevée par le client est la suivante : Nous avons besoin de pouvoir différencier visuellement les environnements lors de l'utilisation d'Ambari et le nom du cluster n'est pas suffisant, comment peut-on changer [...]

By | 2017-07-24T21:37:13+00:00 July 9th, 2017|Hack|0 Comments

MiNiFi: Scalabilité de la données & de l’intérêt de commencer petit

Ce poste fait partie de notre série sur le Dataworks Summit 2017 (ex-Hadoop Summit) Conférence d'Aldrin Piri d'Hortonworks Aldrin nous a rapidement présenté Apache NiFi puis expliqué d'où est venu MiNiFi: un agent NiFi à déployer sur en embarqué afin d'amener la donnée à pipeline d'un cluster NiFi (ex: IoT). Voici les points principaux de [...]

By | 2017-07-24T21:37:13+00:00 July 8th, 2017|Blog, Évènements|0 Comments

Maitrisez vos workflows avec Apache Airflow

Présentation par Christian Trebing de BlueYonder Introduction Use case : comment traiter des données arrivant régulièrement de leurs clients ? Option 1 : utiliser le CRON uniquement des déclancheurs temporels compliqué de gérer les erreurs peu commode lors du chevauchement d'un job en cours avec le lancement du suivant Option 2 : écrire un outil de gestion des [...]

By | 2017-07-24T21:37:13+00:00 July 17th, 2016|Évènements|0 Comments

Apache Apex: l’analytique Big Data nouvelle génération

Présentation par Thomas Weise de DataTorrent (entreprise développant Apex) Introduction Apache Apex est un moteur de traitements parallélisés en mémoire, comme Flink ou Storm. Cependant, il est développé avec un intégration native d'Hadoop : Yarn est utilisé pour la gestion des ressources HDFS est utilisé pour le stockage d'état Modèle de développement applicatif Un stream est une [...]

By | 2017-07-24T21:37:13+00:00 July 17th, 2016|Évènements|0 Comments

EclairJS – Un peu de Spark dans les Web Apps

Présentation de David Fallside, IBM. Les images sont issues des slides de présentation. Introduction Le développement d'applications Web est passé d'un environnement Java vers des environnements Javascript avec NodeJS qui fournit des outils simples et riche à la fois avec NPM. EclairJS est une librairie NodeJS fournissant des binding sur une application Spark : Un RDD est [...]

By | 2017-07-24T21:37:14+00:00 July 17th, 2016|Évènements|0 Comments