Petra Kaferle Devisschere est une Data Scientist avec 13 ans d’expérience en analyse de données. Elle a développé des protocoles et différents outils pour standardiser et accélérer l’analyse de données en laboratoires de recherche. Elle a traite les données provenant de sources multiples : récupération, nettoyage, intégration, analyse et visualisation. Après une reprise d’études en Data Science et IA, elle a commencé à explorer le sujet de l’industrialisation des données tout au long de leur cycle de vie jusqu’à leur mise en production et leur exploitation. Pendant son stage, elle a réalisé des POCs de déploiement de modèles de Machine Learning (ML) sur les plateformes cloud Azure et Databricks.
Son expérience dans la gestion d’un laboratoire scientifique lui a également apporté des capacités en gestion de projets, en communication avec l’ensemble des parties prenantes et dans la construction de solutions applicatives.
Articles publiés

H2O en pratique : un protocole combinant AutoML et les approches de modélisation traditionnelles
Catégories : Data Science, Formation | Tags : Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python, XGBoost
H20 est livré avec de nombreuses fonctionnalités. La deuxième partie de la série H2O en pratique propose un protocole pour combiner la modélisation AutoML avec des approches de modélisation et d…
12 nov. 2021

H2O en pratique: retour d'expérience d'un Data Scientist
Catégories : Data Science, Formation | Tags : Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python
Les plates-formes d’apprentissage automatique (AutoML) gagnent en popularité et deviennent un outil puissant à disposition des data scientists. Il y a quelques mois, j’ai présenté H2O, une plate-forme…
29 sept. 2021

TensorFlow Extended (TFX) : les composants et leurs fonctionnalités
Catégories : Big Data, Data Engineering, Data Science, Formation | Tags : Beam, Data Engineering, Pipeline, CI/CD, Data Science, Deep Learning, Déploiement, Machine Learning, MLOps, Open source, Python, TensorFlow
La mise en production des modèles de Machine Learning (ML) et de Deep Learning (DL) est une tâche difficile. Il est reconnu qu’elle est plus sujette à l’échec et plus longue que la modélisation…
5 mars 2021