Blog

Remède à l’aveuglement de Kafka

Il est difficile de visualiser pour les développeurs, opérateurs et manageurs, ce qui se cache à l’intérieur des entrailles de Kafka. Cet article parle d’une nouvelle interface graphique bientôt disponible. L’interface fut présenté par George Vettcaden, VP Management product chez Hortonworks, en avant première lors de la conférence du DataWorks Summit de Juin 2018 à [...]

Par |2018-06-21T13:08:45+00:00June 20th, 2018|Big Data, DataWorks Summit 2018|0 commentaire

Environnement de développement CoreOS avec Vagrant et VirtualBox

Suivre les instructions de CoreOS sur la façon de configurer un environnement de développement dans VirtualBox n’a pas bien fonctionné pour moi. Voici les étapes que j’ai suivies pour que Container Linux fonctionne avec Vagrant. […]

Par |2018-06-21T11:03:50+00:00June 20th, 2018|Conteneur, DevOps|0 commentaire

Ingestion de Data Lake, quelques bonnes pratiques

La création d’un Data Lake demande de la rigueur et de l’expérience. Voici plusieurs bonnes pratiques autour de l’ingestion des données en batch et en flux continue que nous recommendons et mettons en place lorsque nous accompagnons nos clients. […]

Par |2018-06-18T09:29:42+00:00June 18th, 2018|Data Engineering, DevOps|0 commentaire

DataWorks Summit 2018 – Quelques jours à Berlin

L’équipe Adaltas s’est rendu au complet à la conférence DataWorks Summit 2018 qui a eu lieu à Berlin les 18 et 19 avril. A cette occasion, nous avons compilé une série d’articles sur les présentations qui nous ont les plus marquées. […]

Par |2018-07-07T10:47:21+00:00June 5th, 2018|DataWorks Summit 2018|0 commentaire

Accélérer vos requêtes avec les vues matérialisées dans Apache Hive

Jesus Camacho Rodriguez a organisé une présentation “Accelerating query processing with materialized views in Apache Hive” sur une nouvelle fonctionnalité  à venir dans Apache Hive 3.0 : les vues matérialisées. Cet article va décrire le principe général de cette fonctionnalité, donner quelques exemples et les améliorations prévues dans la roadmap du projet. […]

YARN et la distribution de GPU pour le machine learning

Dans cet article nous verrons les principes fondamentaux du Machine Learning et les outils actuellement utilisés pour executer ce type d’algorithmes, puis nous expliquerons comment un gestionnaire de ressource tel que YARN peut s’avérer utile dans ce contexte et comment il peut aider des algorithmes à s’executer sereinement. Cet article s’inspire d’une conférence du DataWork [...]

Par |2018-06-07T10:25:04+00:00May 30th, 2018|Data Science, DataWorks Summit 2018|1 Comment

Apache Metron dans le monde réel

Apache Metron est une plateforme d’analyse et de stockage spécialisé dans la sécurité informatique. La conférence a été présentée par Dave Russell, ingénieur en chef des solutions – EMEA + APAC chez Hortonworks au Dataworks Summit 2018 (Berlin). Elle a pour objectif de démontrer les usages et les capacités d’Apache Metron dans le monde réel. [...]

Apache Hadoop YARN 3.0 – État de l’art

Cet article couvre la présentation “Apache Hadoop YARN: state of the union” (YARN état de l’art) par Wangda Tan d’Hortonworks lors de la conférence DataWorks Summit 2018 Berlin (anciennement Hadoop Summit). […]