
Formation BIG DATA Hadoop Stockage avec HBase
Domaine : Data Science – Deep learning
DURÉE
2 jour(s)
OBJECTIFS
Comprendre le fonctionnement de HBase. Savoir mettre en place une configuration distribuée.
Pré-requis
Connaissance des principes de base Hadoop et des bases de données.
Participants
Chef de projet, administrateur et toute personne souhaitant stocker des données avec HBase.
coût
Nous contacter pour une formation sur mesure ou en intra
LIEUx de formation
Notre centre de formation à Sophia AntipolisOu sur votre site en formation intra
PROGRAMME DE FORMATION
BIG DATA Hadoop Stockage avec HBase
Introduction
Rappels rapides sur l’écosystème Hadoop
Les fonctionnalités du framework Hadoop
Le projet et les modules (Hadoop Common, HDFS, Yarn, Spark, MapReduce)
Présentation Hbase (Historique, Lien avec HDFS, Format des données dans Hbase)
Définitions (Table, région, ligne, famille de colonnes, cellules, espace de nommage…)
Fonctionnalités (Failover automatique, sharding, interface avec des jobs MapReduce)
Les fonctionnalités du framework Hadoop
Le projet et les modules (Hadoop Common, HDFS, Yarn, Spark, MapReduce)
Présentation Hbase (Historique, Lien avec HDFS, Format des données dans Hbase)
Définitions (Table, région, ligne, famille de colonnes, cellules, espace de nommage…)
Fonctionnalités (Failover automatique, sharding, interface avec des jobs MapReduce)
Architecture
HBase Master node, Region Master (Liens avec les clients Hbase)
Présentation du rôle de Zookeeper
Présentation du rôle de Zookeeper
Installation
Choix des packages
Installation et configuration dans le fichier conf/hbase-site.xml
Installation en mode distribué
Test de connexion avec HBase Shell
Travaux pratiques (Interrogations depuis le serveur http intégré)
Installation et configuration dans le fichier conf/hbase-site.xml
Installation en mode distribué
Test de connexion avec HBase Shell
Travaux pratiques (Interrogations depuis le serveur http intégré)
HBase utilisation Shell
Présentation des différentes interfaces disponibles
Commandes de base, syntaxe, variables
Manipulation des données (Create, list, put, scan, get)
Désactiver une table ou l’effacer (Disable (enable), drop…)
Programmation de scripts
Gestion des tables (Principe des filtres, Mise en oeuvre de filtres de recherche, Paramètres des tables)
Présentation des espaces de nommage
Commandes de base, syntaxe, variables
Manipulation des données (Create, list, put, scan, get)
Désactiver une table ou l’effacer (Disable (enable), drop…)
Programmation de scripts
Gestion des tables (Principe des filtres, Mise en oeuvre de filtres de recherche, Paramètres des tables)
Présentation des espaces de nommage
Cluster Hbase
Fonctionnement en mode distribué
Première étape (Fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper))
Passage au mode distribué (Mise en oeuvre avec HDFS dans un environnement distribué)
Travaux pratiques (Sur un exemple de tables réparties : mise en oeuvre des splits)
Première étape (Fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper))
Passage au mode distribué (Mise en oeuvre avec HDFS dans un environnement distribué)
Travaux pratiques (Sur un exemple de tables réparties : mise en oeuvre des splits)
Programmation
Introduction, les APIs (REST, Avro, Thrift, Java, Ruby, Spark…)
Principe des accès JMX (Démonstration avec Prometheus)
Exemple de programmation d’un client Java
Gestion des tables (Lien avec map/reduce)
Travaux pratiques (Lancement et écriture de programmes Spark)
Principe des accès JMX (Démonstration avec Prometheus)
Exemple de programmation d’un client Java
Gestion des tables (Lien avec map/reduce)
Travaux pratiques (Lancement et écriture de programmes Spark)
dates des formations a grenoble
dates des formations a SOPHIA ANTIPOLIS
formations associées
- Apache Flink
- Flux de données avec Storm
- Blockchain : Mise en pratique
- Apache Pig : Développement de scripts
- Apache Cassandra : Administration
- BIG DATA Gestion et pilotage de projets
- BIG DATA Architecture et technologies
- BIG DATA Hadoop Infrastructure sécurisée
- BIG DATA Cassandra
- BIG DATA Hadoop - L’écosysteme
- BIG DATA Elastic Stack : Présentation
- BIG DATA Elastic Stack pour administrateurs
- BIG DATA Intégration SQL, Hive, SparkDataFrames
- BIG DATA Hadoop Cloudera Administration
- BIG DATA Kafka : Ingestion et traitement de messages
- BIG DATA NEO4J Graphes et analyse
- BIG DATA Hadoop Développement
- BIG DATA Hadoop EMR
- BIG DATA Programmation R et intégration Big Data
- BIG DATA Hadoop Hortonworks Administration
- BIG DATA Spark : Traitement de données
- BIG DATA Supervision
- BIG DATA La synthèse