Formation HBase, Mise en oeuvre d'une base de données NoSQL

Inspirée des publications de Google sur BigTable, HBase est un SGBD non relationnel capable de gérer d’énormes quantités de données. Sous projet d’Hadoop, il permet de distribuer les données en utilisant le système de fichiers distribué HDFS (Hadoop Distributed File System) du Framework. Son fonctionnement, qui repose donc sur le stockage distribué des données sur un cluster de machines physiques, garantit à la fois la haute disponibilité et les hautes performances des bases. Deux arguments de poids qui suffisent à comprendre le succès croissant de la solution. A l’issue de cette formation, les participants disposeront des connaissances et compétences nécessaires à la mise en oeuvre de HBase. De l’installation du système à sa mise en oeuvre opérationnelle avec HDFS, les différentes étapes de son adoption sont couvertes par ce programme.

PROGRAMME DE FORMATION

 

Introduction

  • Rappels rapides sur l’écosystème Hadoop
  • Les fonctionnalités du framework Hadoop
  • Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
  • Présentation HBase
  • Historique
  • Lien avec HDFS
  • Format des données dans HBase
  • Définitions : table, région, ligne, famille de colonnes, cellules, espace de nommage, …
  • Fonctionnalités : failover automatique, sharding, interface avec des jobs MapReduce

Architecture

  • HBase master node, Region Master, liens avec les clients HBase
  • Présentation du rôle de Zookeeper

Installation

  • Choix des packages
  • Installation et configuration dans le fichier conf/hbase-site.xml
  • Démarrage en mode standalone start-hbase
  • Test de connexion avec hbase shell
  • Installation en mode distribué
  • Interrogations depuis le serveur http intégré

HBase utilisation : shell

  • Présentation des différentes interfaces disponibles
  • Travaux pratiques avec hbase shell
  • Commandes de base, syntaxe, variables, manipulation des données : create, list, put, scan, get
  • Désactiver une table ou l’effacer : disable (enable), drop, …
  • Programmation de scripts
  • Gestion des tables : principe des filtres
  • Mise en oeuvre de filtres de recherche, paramètres destables
  • Présentation des espaces de nommage

Cluster HBase

  • Fonctionnement en mode distribué
  • Première étape : fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper)
  • Passage au mode distribué : mise en oeuvre avec HDFS dans un environnement distribué
  • Sur un exemple de tables réparties : mise en oeuvre des splits

Programmation

  • Introduction, les APIs (REST, Avro, Thrift, Java, Ruby, …)
  • Utilisation d’un client Java
  • Gestion des tables
  • Lien avec MapReduce
  • Principe des accès JMX
  • Création d’un client JMX

Objectifs pédagogiques

  • Comprendre le fonctionnement de HBase
  • Être en mesure de mener à bien l’installation du système
  • Savoir mettre en place une configuration distribuée

Participants

  • Chefs de projet, administrateurs et toute personne souhaitant stocker des données avec Hbase

Prérequis

  • Connaissance des principes de base Hadoop et des bases de données
Les cours ont lieu de 9h à 12h30 et de 14h à 17h30
Les participants sont accueillis à partir de 8h45
 
Durée : 2 jours
Réf : FHMN
Prix  2020 : 1000 € H.T.
Pauses et déjeuners offerts

Cette formation vous intéresse

Notre équipe est à votre écoute pour étudier vos besoins en formation et vous proposer les meilleures solutions.
Contactez-nous pour fixer un rendez-vous ou décrivez-nous votre projet. Nous prendrons contact avec vous rapidement.