SAUVAGE Pierre

Architecte Solution Big Data

Passionné d’informatique depuis sa plus tendre enfance, et pratiquant la programmation en loisir depuis l’adolescence, Pierre rejoint une école d’ingénieur avec spécialisation en Système d’Information, option Big Data.

Il a commencé sa carrière en laboratoire de recherche sur IoT, où il a pu étudier les systèmes distribués, tant sur un plan théorique que pratique. Pierre a ensuite rejoint Adaltas. Il est aujourd’hui un architecte solution Big Data & Hadoop et un Data Engineer avec plus de 4 ans d’expérience sur Hadoop et 5 ans d’expérience avec les systèmes distribués. Il a conçu, développé et opéré des workflows d’ingestion de données et des services temps réels tout en accompagnant ses clients dans la définition de leurs besoins et dans leur mise en application.

Il est polyvalent sur les plateformes Big Data, de la planification, la conception et l’architecture du déploiement de clusters, l’administration, la maintenance ainsi que le prototypage et l’industrialisation d’application en collaboration avec les utilisateurs métiers, les analystes, les data scientists, les ingénieurs et les équipes d’exploitation. Il est aussi doté d’une forte expérience en tant que formateur (il donne régulièrement des cours et formations autour du Big Data pour diverses écoles ingénieur et master) facilitant le transfert de connaissance et la formation des équipes.

Articles publiés

Installation de TensorFlow avec Docker

Installation de TensorFlow avec Docker

Catégories : Orchestration de conteneurs, Data Science, Formation | Tags : IA, CPU, Deep Learning, Docker, Jupyter, Linux, TensorFlow

TensorFlow est un logiciel open source de Google pour le calcul numérique utilisant une représentation en graph : Vertex (nodes) représentent des opérations mathématiques Edges représentent un tableau…

By SAUVAGE Pierre

5 août 2019

Intégration de Druid et Hive

Intégration de Druid et Hive

Catégories : Big Data, Business Intelligence, Tech Radar | Tags : Druid, Hive, Analyse de données, Enseignement et tutorial, LLAP, OLAP, SQL

Nous allons dans cet article traiter de l’intégration entre Hive Interactive (LLAP) et Druid. Cet article est un complément à l’article Ultra-fast OLAP Analytics with Apache Hive and Druid.…

By SAUVAGE Pierre

13 juin 2019

Méthodes de stockage persistées dans Kubernetes

Méthodes de stockage persistées dans Kubernetes

Catégories : Cloud computing, Orchestration de conteneurs, Open Source Summit Europe 2017 | Tags : Docker, GCE, Kubernetes, Container Storage Interface (CSI), PVC, Azure, Storage

Cet article est basé sur la présentation “Introduction to Kubernetes Storage Primitives for Stateful Workloads”par the {Code} team à la conférence OSS 2017 à Prague. Commençons par qu’est-ce que…

By SAUVAGE Pierre

28 oct. 2017

Administration Hadoop multitenant avancée - protection de Zookeeper

Administration Hadoop multitenant avancée - protection de Zookeeper

Catégories : Big Data, Infrastructure | Tags : Zookeeper, Partitionnement, DoS, iptables, Exploitation, Passage à l'échelle

Zookeeper est un composant critique au fonctionnement d’Hadoop en haute disponibilité. Ce dernier se protège en limitant le nombre de connexions max (maxConns=400). Cependant Zookeeper ne se protège…

By SAUVAGE Pierre

5 juil. 2017

Apache Apex avec Apache SAMOA

Apache Apex avec Apache SAMOA

Catégories : Data Science, Évènements, Tech Radar | Tags : Apex, Flink, Samoa, Storm, Machine Learning, Tools, Hadoop

Le Machine learning Orienté batch Supervisé - plus courant Training et Scoring Construction préliminaire du modèle Training : Construction du modèle Holdout : tuning du paramétrage Test : précision…

By SAUVAGE Pierre

17 juil. 2016

Namespace réseau sans Docker

Namespace réseau sans Docker

Catégories : Hack | Tags : DNS, Docker, Linux, Namespaces, Réseau, VLAN

Imaginons le cas suivant : Je suis connecté à plusieurs réseaux (wlan0, eth0, usb0). Je veux choisir le réseau que je vais utiliser au lancement de mon application. Mon application ne permet pas de…

By SAUVAGE Pierre

6 juil. 2016

Canada - Morocco - France

International locations

10 rue de la Kasbah
2393 Rabbat
Canada

Nous sommes une équipe passionnées par l'Open Source, le Big Data et les technologies associées telles que le Cloud, le Data Engineering, la Data Sciencem le DevOps…

Nous fournissons à nos clients un savoir faire reconnu sur la manière d'utiliser les technologies pour convertir leurs cas d'usage en projets exploités en production, sur la façon de réduire les coûts et d'accélérer les livraisons de nouvelles fonctionnalités.

Si vous appréciez la qualité de nos publications, nous vous invitons à nous contacter en vue de coopérer ensemble.