Reprise d’un cluster en production par Ambari

Reprise d’un cluster en production par Ambari2018-10-23T19:40:18+00:00

Introduction

Au fil des années, Apache Ambari est devenu un produit mature. Ceci n’a pas toujours été le cas et il fut un temps où il était nécessaire d’automatiser ses propres scripts de déploiement pour exploiter un cluster sécurisé et multi-tenant. L’heure est venue de donner le contrôle à Ambari.

Duration: 1h30
Format: démonstration

Présentation

En tant qu’ingénieur Big Data vous avez probablement déjà essayé la sanbox HDP ou même installé un cluster vous même. Dans la plupart des cas, vous avez utilisé Apache Ambari pour déployer et gérer les services et configurations de vos clusters. Imaginez maintenant une époque pas si lointaine où Ambari ne savait pas gérer SSL, Kerberos, la haut disponibilité des services, etc. Ryba est un outil open source développé par Adaltas qui permet de boostraper et de gérer des clusters Hadoop. Il a été bâtit de A à Z avec pour l’une des idées de départ de palier aux manquements d’Ambari. Maintenant imaginez que vous décidiez de donner une seconde chance à Ambari et lui donner le contrôle total sur votre cluster déployé manuellement. C’est ce que nous avons appelé l'”Ambari Takeover” et ce que nous allons détailler ensemble.

Dans cette présentation nous allons apprendre les rouages qui font fonctionner l’interface utilisateur: l’API d’Apache Ambari. Nous reviendrons également sur la genèse et le développement du projet Ryba. Enfin nous terminerons par une démonstration d’un cluster Hadoop pré-installé.

Auteur

Leo Schoukroun, consultant Big Data chez Adaltas. Actuellement en mission chez EDF, je participe aux déploiements et à la maintenance de plusieurs clusters Hadoop hébergés sur site.

Le projet  ryba-ambari-takeover  a été entièrement réalisé par Lucas Bakalian.