Inspirée des publications de Google sur BigTable, HBase est un SGBD non relationnel capable de gérer d’énormes quantités de données. Sous projet d’Hadoop, il permet de distribuer les données en utilisant le système de fichiers distribué HDFS (Hadoop Distributed File System) du Framework. Son fonctionnement, qui repose donc sur le stockage distribué des données sur un cluster de machines physiques, garantit à la fois la haute disponibilité et les hautes performances des bases. Deux arguments de poids qui suffisent à comprendre le succès croissant de la solution. A l’issue de cette formation, les participants disposeront des connaissances et compétences nécessaires à la mise en oeuvre de HBase. De l’installation du système à sa mise en oeuvre opérationnelle avec HDFS, les différentes étapes de son adoption sont couvertes par ce programme.
PROGRAMME PEDAGOGIQUE
OBJECTIFS
PUBLIC CONCERNE
HORAIRES
TARIFS
PROGRAMME PEDAGOGIQUE
PROGRAMME DE FORMATION
Introduction
- Rappels rapides sur l’écosystème Hadoop
- Les fonctionnalités du framework Hadoop
- Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
- Présentation HBase
- Historique
- Lien avec HDFS
- Format des données dans HBase
- Définitions : table, région, ligne, famille de colonnes, cellules, espace de nommage, …
- Fonctionnalités : failover automatique, sharding, interface avec des jobs MapReduce
Architecture
- HBase master node, Region Master, liens avec les clients HBase
- Présentation du rôle de Zookeeper
Installation
- Choix des packages
- Installation et configuration dans le fichier conf/hbase-site.xml
- Démarrage en mode standalone start-hbase
- Test de connexion avec hbase shell
- Installation en mode distribué
- Interrogations depuis le serveur http intégré
HBase utilisation : shell
- Présentation des différentes interfaces disponibles
- Travaux pratiques avec hbase shell
- Commandes de base, syntaxe, variables, manipulation des données : create, list, put, scan, get
- Désactiver une table ou l’effacer : disable (enable), drop, …
- Programmation de scripts
- Gestion des tables : principe des filtres
- Mise en oeuvre de filtres de recherche, paramètres destables
- Présentation des espaces de nommage
Cluster HBase
- Fonctionnement en mode distribué
- Première étape : fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper)
- Passage au mode distribué : mise en oeuvre avec HDFS dans un environnement distribué
- Sur un exemple de tables réparties : mise en oeuvre des splits
Programmation
- Introduction, les APIs (REST, Avro, Thrift, Java, Ruby, …)
- Utilisation d’un client Java
- Gestion des tables
- Lien avec MapReduce
- Principe des accès JMX
- Création d’un client JMX
OBJECTIFS
Objectifs pédagogiques
- Comprendre le fonctionnement de HBase
- Être en mesure de mener à bien l’installation du système
- Savoir mettre en place une configuration distribuée
PUBLIC CONCERNE
Participants
- Chefs de projet, administrateurs et toute personne souhaitant stocker des données avec Hbase
Prérequis
- Connaissance des principes de base Hadoop et des bases de données
HORAIRES
Les cours ont lieu de 9h à 12h30 et de 14h à 17h30
Les participants sont accueillis à partir de 8h45
TARIFS
Durée : 2 jours
Réf : FHMN
Prix 2020 : 1000 € H.T.
Pauses et déjeuners offerts
Cette formation vous intéresse
Notre équipe est à votre écoute pour étudier vos besoins en formation et vous proposer les meilleures solutions.
Contactez-nous pour fixer un rendez-vous ou décrivez-nous votre projet. Nous prendrons contact avec vous rapidement.