Mehdi est un Data Engineer évoluant depuis 2 ans dans l’écosystème du Big Data. Il a notamment conçu et développé des applications de traitement de données en temps réel sur Spark et SparkML, ainsi que des chaînes d’ingestion et de traitement de données impliquant Nifi, Sqoop, Hive, Impala, HBase. Ses langages de programmation préférés sont Java, Python, Scala. Il maîtrise également les aspects de déploiement des clusters CDH, en particulier les outils de science des données (Zeppelin, Jupyter et Cloudera Data Science Workbench).
Il prend souvent du plaisir à révéler les informations cachées au seins des jeux de données et répondre aux questions du client grace à la visualisation de données sur PowerBI.
Il a porté dernièrement toute son attention sur la Computer vision, plus précisément la segmentation d’image grâce aux réseaux de neurones à convolution.
Articles publiés
Introduction à Cloudera Data Science Workbench
Catégories : Data Science | Tags : Cloudera, Docker, Git, Kubernetes, Machine Learning, Azure, Notebook
Cloudera Data Science Workbench est une plateforme qui permet aux Data Scientists de créer, gérer, exécuter et planifier des workflows de Data Science à partir de leur navigateur. Cela leur permet…
28 févr. 2019