paul-adrien

À propos de Paul-Adrien Cordonnier

Paul-Adrien, Data Engineer, a intégré Adaltas en octobre 2017. Il déploie et surveille plusieurs clusters Hadoop et Elasticsearch installés on premise pour un grand compte français. Il est polyvalent sur les sujets de déploiement, récolte de métriques, surveillance et aide à la résolution de problèmes.

Surveillance d’un cluster Hadoop de production avec Kubernetes

La surveillance d’un cluster Hadoop de production est un vrai challenge et se doit d’être en constante évolution. Aujourd’hui, la solution que nous utilisons se base sur Nagios. Efficace en ce qui concerne la surveillance la plus simple, elle n’est pas en mesure de répondre aux besoins de lancement de vérifications plus poussés. Dans cet [...]

Par |2018-12-21T16:31:26+00:00December 21st, 2018|Conteneur, Data Engineering, DevOps|0 commentaire

Accélérer vos requêtes avec les vues matérialisées dans Apache Hive

Jesus Camacho Rodriguez a organisé une présentation “Accelerating query processing with materialized views in Apache Hive” sur une nouvelle fonctionnalité à venir dans Apache Hive 3.0 : les vues matérialisées. Cet article va décrire le principe général de cette fonctionnalité, donner quelques exemples et les améliorations prévues dans la roadmap du projet. […]

Personne* ne met Java dans un containeur

Cette discussion porte sur les problèmes de mettre Java dans un conteneur et comment, dans sa dernière version 9, le JDK est maintenant plus conscient du conteneur dans lequel il s’exécute. La présentation est dirigée par Joerg Schad, ingénieur logiciels distribués de Mesosphere, à l’Open Source Summit 2017 de Prague. […]