Apache HBase

HBase est une base de données NoSQL orientée colonne qui fait partie de l’écosystème Hadoop. C’est une base distribuée open source spécialisée dans le stockage de données volumineuses qui offre des accès avec une faible latence et une forte concurrence. Le stockage est optmisé pour donner accès aux valeurs au travers d'une clé. Les clés sont ordonnées ce qui permet d'effectuer des requêtes d'une clé vers une autre (Range Query). Les données sont écrites dans HDFS, ce qui assure la réplication. Une base HBase est composée d’un master et de workers, selon le même principe que Hadoop. Chaque worker de HBase possède un seul HRegionServer par lequel transit les données. C’est le HRegionServer qui va gérer le stockage des données au sein d’une seule machine. Les données stockées dans HBase sont encapsulées dans des HRegions qui correspondent à un set de fichiers provenant d’une même table (les HFile). Ces HRegions sont gérées par les HRegionServer. Chaque machine peut posséder une ou plusieurs HRegions.

Articles associés

Stage Data Science & Data Engineer - ML en production et ingestion streaming

Catégories : Data Engineering, Data Science | Tags : Flink, Kafka, Spark, DevOps, Hadoop, HBase, Kubernetes, Python

Contexte L’évolution exponentielle des données a bouleversé l’industrie en redéfinissant les méthodes de stockages, de traitement et d’acheminement des données. Maitriser ces méthodes facilite…

WORMS David

By WORMS David

26 nov. 2019

Migration de cluster et de traitements entre Hadoop 2 et 3

Catégories : Big Data, Infrastructure | Tags : HDFS, Shiro, Spark, YARN, Docker, Erasure Coding, Rolling Upgrade

La migration de Hadoop 2 vers Hadoop 3 est un sujet brûlant. Comment mettre à niveau vos clusters, quelles fonctionnalités présentes dans la nouvelle version peuvent résoudre les problèmes actuels et…

BAKALIAN Lucas

By BAKALIAN Lucas

25 juil. 2018

Omid : Traitement de transactions scalables et hautement disponibles pour Apache Phoenix

Catégories : Big Data, DataWorks Summit 2018 | Tags : ACID, Omid, Phoenix, Transaction, HBase, SQL

Apache Omid fournit une couche transactionnelle au-dessus des bases de données clés/valeurs NoSQL. Crédits à Ohad Shacham pour son discours et son travail pour Apache Omid. Cet article est le résultat…

HERMAND Xavier

By HERMAND Xavier

24 mai 2018

Questions essentielles sur les base de données Time Series

Catégories : Big Data | Tags : Druid, Hive, ORC, Elasticsearch, Graphana, IOT, HBase

Aujourd’hui, le gros des données Big Data est de nature temporelle. On le constate dans les médias comme chez nos clients : compteurs intelligents, transactions bancaires, usines intelligentes,…

WORMS David

By WORMS David

19 mars 2018

Stockage HDFS et Hive - comparaison des formats de fichiers et compressions

Catégories : Data Engineering | Tags : Analytique, Hive, ORC, Parquet, Format de fichier

Il y a quelques jours, nous avons conduit un test dans le but de comparer différents format de fichiers et méthodes de compression disponibles dans Hive. Parmi ces formats, certains sont natifs à HDFS…

WORMS David

By WORMS David

15 juil. 2012

Deux Hive UDAF pour convertir une aggregation vers une map

Catégories : Data Engineering | Tags : Hive, Format de fichier, Java, HBase

Je publie deux nouvelles fonctions UDAF pour Hive pour aider avec les map dans Apache Hive. Le code source est disponible sur GitHub dans deux classes Java : “UDAFToMap” et “UDAFToOrderedMap” ou vous…

WORMS David

By WORMS David

6 mars 2012

Installation d'Hadoop et d'HBase sous OSX en mode pseudo-distribué

Catégories : Big Data, Formation | Tags : Big Data, Hue, Déploiement, Infrastructure, Hadoop, HBase

Le système d’exploitation choisi est OSX mais la procédure n’est pas si différente pour tout environnement Unix car l’essentiel des logiciels est téléchargé depuis Internet, décompressé et paramétré…

WORMS David

By WORMS David

1 déc. 2010

Stockage et traitement massif avec Hadoop

Catégories : Big Data, Node.js | Tags : Big Data, Node.js, REST, HBase

HBase est la base de données de type “column familly” de l’écosystème Hadoop construite sur le modèle de Google BigTable. HBase peut accueillir de très larges volumes de données (de l’ordre du tera ou…

WORMS David

By WORMS David

1 nov. 2010

Canada - Morocco - France

International locations

10 rue de la Kasbah
2393 Rabbat
Canada

Nous sommes une équipe passionnées par l'Open Source, le Big Data et les technologies associées telles que le Cloud, le Data Engineering, la Data Science le DevOps…

Nous fournissons à nos clients un savoir faire reconnu sur la manière d'utiliser les technologies pour convertir leurs cas d'usage en projets exploités en production, sur la façon de réduire les coûts et d'accélérer les livraisons de nouvelles fonctionnalités.

Si vous appréciez la qualité de nos publications, nous vous invitons à nous contacter en vue de coopérer ensemble.