cesar

À propos de César Berezowski

César Berezowski est un architecte solution BigData & Hadoop et un Data Engineer avec 3 ans d’expérience sur Hadoop et les systèmes distribués. Il a conçu, développé et opéré des workflows d’ingestion de données et des services temps réels tout en accompagnant ses clients dans la définition de leurs besoins et dans leur mise en application. Il est polyvalent sur les plateformes BigData, de la planification, la conception et l’architecture du déploiement de clusters, l’administration, la maintenance ainsi que le prototypage et l’industrialisation d’applications en collaboration avec les utilisateurs métiers, les analystes, les data scientists, les ingénieurs et les équipes d’exploitation. Il aime découvrir de nouvelles choses et expérimenter de nouvelles technologies au-delà de son travail. Il est aussi doté d’une expérience en tant que formateur facilitant le transfert de connaissance et la formation des équipes.

Apache Flink: passé, présent et futur

Apache Flink est une petite pépite méritant beaucoup plus d’attention. Plongeons nous dans son passé, son état actuel et le futur vers lequel il se dirige avec les keytones et présentations de la Flink Forward 2018. […]

Par |2018-11-15T11:08:44+00:00November 5th, 2018|Big Data, Data Engineering|0 commentaire

De Dockerfile à Ansible Containers

Présentation de Tomas Tomecek, membre de l’équipe containerization de Red Hat. Cette présentation était une introduction au format Dockerfile et à l’outil Ansible Containers puis une comparaison des deux produits. […]

Par |2018-06-05T22:36:51+00:00October 25th, 2017|Open Source Summit Europe 2017|0 commentaire

Changer la couleur de la topbar d’Ambari

J'étais récemment chez un client qui a plusieurs environnements (Prod, Integration, Recette, ...) sur HDP avec chacun son instance Ambari. L'une des questions soulevée par le client est la suivante : Nous avons besoin de pouvoir différencier visuellement les environnements lors de l'utilisation d'Ambari et le nom du cluster n'est pas suffisant, comment peut-on changer [...]

Par |2018-06-05T22:37:02+00:00July 9th, 2017|Hack|0 commentaire

MiNiFi: Scalabilité de la données & de l’intérêt de commencer petit

Ce poste fait partie de notre série sur le Dataworks Summit 2017 (ex-Hadoop Summit) Conférence d'Aldrin Piri d'Hortonworks Aldrin nous a rapidement présenté Apache NiFi puis expliqué d'où est venu MiNiFi: un agent NiFi à déployer sur en embarqué afin d'amener la donnée à pipeline d'un cluster NiFi (ex: IoT). Voici les points principaux de [...]

Par |2018-06-05T22:37:03+00:00July 8th, 2017|Blog, Évènements|0 commentaire

Maitrisez vos workflows avec Apache Airflow

Présentation par Christian Trebing de BlueYonder Introduction Use case : comment traiter des données arrivant régulièrement de leurs clients ? Option 1 : utiliser le CRON uniquement des déclancheurs temporels compliqué de gérer les erreurs peu commode lors du chevauchement d'un job en cours avec le lancement du suivant Option 2 : écrire un outil de gestion des [...]

Par |2018-06-05T22:37:04+00:00July 17th, 2016|Évènements|1 Comment

Apache Apex: l’analytique Big Data nouvelle génération

Présentation par Thomas Weise de DataTorrent (entreprise développant Apex) Introduction Apache Apex est un moteur de traitements parallélisés en mémoire, comme Flink ou Storm. Cependant, il est développé avec un intégration native d'Hadoop : Yarn est utilisé pour la gestion des ressources HDFS est utilisé pour le stockage d'état Modèle de développement applicatif Un stream est une [...]

Par |2018-06-05T22:37:05+00:00July 17th, 2016|Évènements|0 commentaire