Évènements

Articles et notes issues d’évènements tels que des meetups et des conférences

Apache Hive 3, nouvelles fonctionnalités et conseils et astuces

Disponible depuis juillet 2018 avec HDP3 (Hortonworks Data Platform 3), Apache Hive 3 apporte de nombreuses fonctionnalités intéressantes à l’entrepôt de données. Malheureusement, comme beaucoup de versions majeures de logiciels “FOSS”, elle contient quelques écueils et peu de documentation. Je vais d’abord passer en revue les nouvelles fonctionnalités disponibles avec Hive 3, puis donner quelques [...]

Par |2019-07-25T22:29:14+00:00July 25th, 2019|Big Data, DataWorks Summit 2019|0 commentaire

Auto-scaling de Druid avec Kubernetes

Apache Druid est un système de stockage de données open-source destiné à l’analytics qui peut profiter des capacités d’auto-scaling de Kubernetes de par son architecture distribuée. Cet article est inspiré de la présentation “Apache Druid Auto Scale-out/in for Streaming Data Ingestion on Kubernetes” donnée par Jinchul Kim lors du DataWorks Summit 2019 Europe à Barcelone. [...]

Notes du Google Cloud Summit à Paris

Le 18 Juin avait lieu l'édition 2019 du salon annuel de Google à Paris. L'édition Parisienne de cette année a été la plus grande jusqu'à maintenant, ce qui reflète l'engagement de Google à se positionner sur le marché Français. En terme de parts de marché sur le Cloud, la Google Cloud Platform (GCP) est encore [...]

Par |2019-06-26T19:48:09+00:00June 26th, 2019|Évènements|0 commentaire

Multihoming sur Hadoop

Le multihoming, qui implique l’association de plusieurs réseaux à un nœud, permet de gérer l’utilisation de réseaux hétérogènes dans un cluster Hadoop. Cet article est une introduction au concept de multihoming et à ses applications sur des cas d’usages concrets. […]

Une semaine à discuter techno isolés dans un riad Marocain

Adaltas organise sa première conférence entre les 22 et 26 Octobre. Au programme de ces 5 jours de conférence: discuter de technologie dans l'un des plus beau riad de Marrakech. Mélanger l'utile à l'agréable, apprendre et partager les pieds en évantail dans la piscine. La règle est simple, chaque participant s'engage à intervenir au minimum [...]

Par |2019-07-17T13:57:56+00:00October 14th, 2018|Adaltas Summit 2018|0 commentaire

Deep learning sur YARN: lancer Tensorflow et ses amis sur des clusters Hadoop

Avec l'arrivée de Hadoop 3, YARN offre plus de possibilités dans la gestion des ressources. Il est désormais possible de lancer des traitements de Deep Learning sur des GPUs dans des espaces dédiés du cluster. Cet article est basé sur une présentation de Wandga Tan, membre du PMC Apache Hadoop, lors du DataWorks Summit 2018. [...]

Remède à l’aveuglement de Kafka

Il est difficile de visualiser pour les développeurs, opérateurs et manageurs, ce qui se cache à l’intérieur des entrailles de Kafka. Cet article parle d’une nouvelle interface graphique bientôt disponible. L’interface fut présentée par George Vettcaden, VP Management product chez Hortonworks, en avant première lors de la conférence du DataWorks Summit de Juin 2018 à [...]

Par |2019-02-08T09:57:02+00:00June 20th, 2018|Big Data, DataWorks Summit 2018|0 commentaire