Évènements

Articles et notes issues d’évènements tels que des meetups et des conférences

Kubernetes 1.8

L’arrivée de Kubernetes 1.8 apporte son lot de nouveautés. Grâce à plus de 2500 pull requests, 2000 commits, avec environ 400 commiters, Kubernetes a su rajouter 39 fonctionnalités en plus à la version 1.8. C’est l’une des versions les plus riches en nouveauté, pour comparaison la version 1.7 n’en contenait que 28. Sur cette nouvelle release, [...]

By | 2017-11-23T11:22:15+00:00 October 24th, 2017|Open Source Summit Europe 2017|0 Comments

MiNiFi: Scalabilité de la données & de l’intérêt de commencer petit

Ce poste fait partie de notre série sur le Dataworks Summit 2017 (ex-Hadoop Summit) Conférence d'Aldrin Piri d'Hortonworks Aldrin nous a rapidement présenté Apache NiFi puis expliqué d'où est venu MiNiFi: un agent NiFi à déployer sur en embarqué afin d'amener la donnée à pipeline d'un cluster NiFi (ex: IoT). Voici les points principaux de [...]

By | 2017-07-24T21:37:13+00:00 July 8th, 2017|Blog, Évènements|0 Comments

Apache Apex avec Apache SAMOA

Le Machine learning Orienté batch Supervisé - plus courant Training et Scoring Construction préliminaire du modèle Training: Construction du modèle Holdout: tuning du paramétrage Test: précision Online Machine Learning Streaming Modèle évolutif Adaptation dynamique au nouveaux patterns de la données Changement à travers le temps (concept drift) Mise à jour du modèle Utilisation généralisée des [...]

By | 2017-07-24T20:35:56+00:00 July 17th, 2016|Évènements|0 Comments

Maitrisez vos workflows avec Apache Airflow

Présentation par Christian Trebing de BlueYonder Introduction Use case : comment traiter des données arrivant régulièrement de leurs clients ? Option 1 : utiliser le CRON uniquement des déclancheurs temporels compliqué de gérer les erreurs peu commode lors du chevauchement d'un job en cours avec le lancement du suivant Option 2 : écrire un outil de gestion des [...]

By | 2017-07-24T21:37:13+00:00 July 17th, 2016|Évènements|0 Comments

Apache Apex: l’analytique Big Data nouvelle génération

Présentation par Thomas Weise de DataTorrent (entreprise développant Apex) Introduction Apache Apex est un moteur de traitements parallélisés en mémoire, comme Flink ou Storm. Cependant, il est développé avec un intégration native d'Hadoop : Yarn est utilisé pour la gestion des ressources HDFS est utilisé pour le stockage d'état Modèle de développement applicatif Un stream est une [...]

By | 2017-07-24T21:37:13+00:00 July 17th, 2016|Évènements|0 Comments

EclairJS – Un peu de Spark dans les Web Apps

Présentation de David Fallside, IBM. Les images sont issues des slides de présentation. Introduction Le développement d'applications Web est passé d'un environnement Java vers des environnements Javascript avec NodeJS qui fournit des outils simples et riche à la fois avec NPM. EclairJS est une librairie NodeJS fournissant des binding sur une application Spark : Un RDD est [...]

By | 2017-07-24T21:37:14+00:00 July 17th, 2016|Évènements|0 Comments