Tech Radar

Intégration de Druid et Hive

Nous allons dans cet article traiter de l'intégration entre Hive Interactive (LLAP) et Druid. Cet article est un complément à l'article Ultra-fast OLAP Analytics with Apache Hive and Druid Présentation des Outils Hive et Hive LLAP Hive est un environnement permettant l'exécution de requêtes SQL sur des données stockées dans HDFS. Hive peut configurer différents exécuteurs [...]

Par |2019-06-18T09:09:24+00:00June 13th, 2019|Big Data, Blog, Tech Radar|2 Commentaires

Le moteur Vespa de Yahoo

Vespa est le moteur de services et de traitements big data complètement autonome et autosuffisant de Yahoo. Il a pour but de servir les résultats de requêtes sur d’énorme quantité de données en temps réel. Un exemple serait de servir des résultats de recherches ou des recommandations à un utilisateur. Yahoo – ou Oath – [...]

Par |2019-06-21T23:53:06+00:00October 16th, 2017|Tech Radar|0 commentaire

Maitrisez vos workflows avec Apache Airflow

Ci-dessous une compilation de mes notes prises lors de la présentation d'Airflow par Christian Trebing de chez BlueYonder. Introduction Use case : comment traiter des données arrivant régulièrement de leurs clients ? Option 1 : utiliser le CRON Uniquement des déclancheurs temporels Compliqué de gérer les erreurs Peu commode lors du chevauchement d'un job en cours [...]

Par |2019-06-19T07:08:31+00:00July 17th, 2016|Évènements, Tech Radar|1 Comment

Apache Apex: l’analytique Big Data nouvelle génération

Ci-dessous une compilation de mes notes prises lors de la présentation d'Apache Apex par Thomas Weise de DataTorrent, l'entreprise derrière Apex. Introduction Apache Apex est un moteur de traitements parallélisés en mémoire, comme Flink ou Storm. Cependant, il est développé avec une intégration native d'Hadoop : Yarn est utilisé pour la gestion des ressources HDFS [...]

Notes sur le rapport Gallois par une entreprise informatique

Dans le cadre de la lecture du rapport Gallois rendu publique hier, j’ai conservé quelques notes qui après recompilation sont publiées en ligne. On peut certes regretter le manque de mention sur le secteur informatique mais le rapport affiche sa volonté de ne pas proposer de préconisations sectorielles. Le résumé qui en débouche n’est pas [...]

Par |2019-06-26T20:59:16+00:00July 6th, 2012|Tech Radar|0 commentaire

Node intégré à la plateforme cloud Microsoft Azure

Node est désormais un citoyen de premier ordre dans l’environnement cloud de Microsoft Azure au côté de .Net, Java et PHP. Cette intégration est la conséquence logique de l’implication de Microsoft dans le développement de Node il y a maintenant un an. A l’origine seulement disponible sur les plateformes de type Unix (Linux, OSX, …), [...]

Par |2019-06-23T21:52:54+00:00December 11th, 2011|Tech Radar|0 commentaire