Formation Cassandra, Mise en oeuvre d'une base de données NoSQL

Système de gestion de base de données NoSQL, Cassandra a été conçu pour gérer des quantités massives de données réparties sur plusieurs serveurs tout en assurant une disponibilité maximale des données qu’elle héberge. De par sa structure décentralisée, Cassandra offre nativement une tolérance aux pannes individuelles. Enfin, supportant l’intégration avec Hadoop, Cassandra pourrait se révéler une plateforme d’avenir pour les projets Big Data. Les participants à cette formation acquerront, en 3 jours, les compétences nécessaires pour mettre en oeuvre une solution de données avec Cassandra.

PROGRAMME DE FORMATION

 

Introduction

  • Historique, fonctionnalités de Cassandra, licence
  • Format des données, « Key-value », traitement de volumes importants
  • Haute disponibilité, système réparti de base de données, …

Installation et configuration

  • Prérequis
  • Plates-formes supportées
  • Étude du fichier de configuration : conf/cassandra.yaml
  • Répertoire de travail, de stockage des données, gestion de la mémoire
  • Démarrage d’un noeud et test de l’interface cliente cqlsh

CQL

  • Commandes de base : connexion au système de base de données
  • Création de colonnes, insertion, modification recherche
  • Le CQL : Cassandra Query Language
  • Exécution de scripts
  • Comment écrire des requêtes ?
  • Approches

Gestion de la grappe

  • Principe
  • Préparation du premier noeud : adresse d’écoute
  • Configuration de nouveaux noeuds
  • Notion de bootstrapping et de token
  • Paramètres listen_address et rpc_address
  • Réplication : topologie du réseau et EndpointSnitch
  • Stratégie de réplication
  • Ajout de noeuds, suppression
  • Cassandra dans un Cloud
  • Mise en oeuvre avec OpenStack

Supervision

  • OpsCenter : installation, lancement
  • Utilisation de base
  • Supervision avec nodetool cfstats, ou export JMX vers des outils de supervision comme Nagios

Exploitation

  • Sauvegardes
  • Import/export au format JSON

Support Hadoop

  • Principe de MapReduce
  • Implémentation Hadoop
  • Mise en oeuvre depuis Cassandra

Support Spark

  • Description rapide de l’architecture Spark
  • Mise en oeuvre depuis Cassandra
  • Exécution de travaux Spark s’appuyant sur une grappe Cassandra

Objectifs pédagogiques

  • Connaître les apports de Cassandra par rapport à d’autres solutions existantes
  • Savoir installer et configurer le SGDB Cassandra
  • Pouvoir maîtriser le CQL
  • Apprendre à gérer Cassandra en production avec OpsCenter
  • Être capable d’interfacer avec Hadoop et Spark

Participants

  • Chefs de projet, gestionnaires de bases de données

Prérequis

  • Connaissances générales sur les bases de données
Les cours ont lieu de 9h à 12h30 et de 14h à 17h30
Les participants sont accueillis à partir de 8h45
 
Durée : 3 jours
Réf : CMBN
Prix  2020 : 1500 € H.T.
Pauses et déjeuners offerts

Cette formation vous intéresse

Notre équipe est à votre écoute pour étudier vos besoins en formation et vous proposer les meilleures solutions.
Contactez-nous pour fixer un rendez-vous ou décrivez-nous votre projet. Nous prendrons contact avec vous rapidement.