Évènements

Articles et notes issues d’évènements tels que des meetups et des conférences

Notes du Google Cloud Summit à Paris

Le 18 Juin avait lieu l'édition 2019 du salon annuel de Google à Paris. L'édition Parisienne de cette année a été la plus grande jusqu'à maintenant, ce qui reflète l'engagement de Google à se positionner sur le marché Français. En terme de parts de marché sur le Cloud, la Google Cloud Platform (GCP) est encore [...]

Par |2019-06-26T19:48:09+00:00June 26th, 2019|Évènements|0 commentaire

Multihoming sur Hadoop

Le multihoming, qui implique l’association de plusieurs réseaux à un nœud, permet de gérer l’utilisation de réseaux hétérogènes dans un cluster Hadoop. Cet article est une introduction au concept de multihoming et à ses applications sur des cas d’usages concrets. […]

Deep learning sur YARN: lancer Tensorflow et ses amis sur des clusters Hadoop

Avec l'arrivée de Hadoop 3, YARN offre plus de possibilités dans la gestion des ressources. Il est désormais possible de lancer des traitements de Deep Learning sur des GPUs dans des espaces dédiés du cluster. Cet article est basé sur une présentation de Wandga Tan, membre du PMC Apache Hadoop, lors du DataWorks Summit 2018. [...]

Remède à l’aveuglement de Kafka

Il est difficile de visualiser pour les développeurs, opérateurs et manageurs, ce qui se cache à l’intérieur des entrailles de Kafka. Cet article parle d’une nouvelle interface graphique bientôt disponible. L’interface fut présentée par George Vettcaden, VP Management product chez Hortonworks, en avant première lors de la conférence du DataWorks Summit de Juin 2018 à [...]

Par |2019-02-08T09:57:02+00:00June 20th, 2018|Big Data, DataWorks Summit 2018|0 commentaire

DataWorks Summit 2018 – Quelques jours à Berlin

L’équipe Adaltas s’est rendue au complet à la conférence DataWorks Summit 2018 qui a eu lieu à Berlin les 18 et 19 avril. A cette occasion, nous avons compilé une série d’articles sur les présentations qui nous ont les plus marquées. […]

Par |2019-02-07T18:28:08+00:00June 5th, 2018|DataWorks Summit 2018|0 commentaire

Accélérer vos requêtes avec les vues matérialisées dans Apache Hive

Jesus Camacho Rodriguez a organisé une présentation “Accelerating query processing with materialized views in Apache Hive” sur une nouvelle fonctionnalité à venir dans Apache Hive 3.0 : les vues matérialisées. Cet article va décrire le principe général de cette fonctionnalité, donner quelques exemples et les améliorations prévues dans la roadmap du projet. […]

YARN et la distribution de GPU pour le machine learning

Dans cet article nous verrons les principes fondamentaux du Machine Learning et les outils actuellement utilisés pour exécuter ce type d’algorithmes, puis nous expliquerons comment un gestionnaire de ressources tel que YARN peut s’avérer utile dans ce contexte et comment il peut aider des algorithmes à s’exécuter sereinement. Cet article s’inspire d’une conférence du DataWork [...]

Par |2019-02-07T18:15:41+00:00May 30th, 2018|Data Science, DataWorks Summit 2018|1 Comment