
Formation BIG DATA Hadoop Hortonworks Administration
Domaine : Data Science – Deep learning
DURÉE
3.0 jour(s)
OBJECTIFS
Connaître les principes du framework Hadoop. Savoir linstaller, le configurer et ladministrer avec Ambari (tableaux de bord, supervision, gestion des services
).
Pré-requis
Connaissance des commandes des systèmes Unix/Linux et des bases TCP/IP.
Participants
Chef de projet, administrateur et toute personne souhaitant mettre en oeuvre un système distribué avec Hadoop.
coût
Nous contacter pour une formation sur mesure ou en intra
LIEUx de formation
Notre centre de formation à GrenobleNotre centre de formation à MoiransNotre centre de formation à Sophia Antipolis
Sur votre site en formation intraEn classe distancielle
PROGRAMME DE FORMATION
BIG DATA Hadoop Hortonworks Administration
Introduction
Les fonctionnalités du framework Hadoop (Les différentes versions)
Distributions (Apache, Cloudera, Hortonworks, EMR, MapR, DES, Spécificités de chaque distribution)
Architecture et principe de fonctionnement
Terminologie (NameNode, DataNode, ResourceManager, NodeManager, Rôle des différents composants)
Le projet et les modules (Hadoop Common, HDFS, YARN, Spark, MapReduce, Oozie, Tez, Pig, Hive, HBase )
Distributions (Apache, Cloudera, Hortonworks, EMR, MapR, DES, Spécificités de chaque distribution)
Architecture et principe de fonctionnement
Terminologie (NameNode, DataNode, ResourceManager, NodeManager, Rôle des différents composants)
Le projet et les modules (Hadoop Common, HDFS, YARN, Spark, MapReduce, Oozie, Tez, Pig, Hive, HBase )
Les outils Hadoop
Infrastructure/mise en oeuvre (Avro, Ambari, Zookeeper, Pig, Tez, Oozie, Vue d'ensemble, Gestion des données, Exemple de sqoop)
Restitution (Webhdfs, hive, Hawq, Mahout, ElasticSearch )
Outils complémentaires de traitement (Spark, SparkQL, Spark/ML, Storm, BigTop, Zebra)
Outils complémentaires de développement (Cascading, Scalding, Flink)
Outils complémentaires d'analyse (RHadoop, Hama, Chukwa, Kafka)
Restitution (Webhdfs, hive, Hawq, Mahout, ElasticSearch )
Outils complémentaires de traitement (Spark, SparkQL, Spark/ML, Storm, BigTop, Zebra)
Outils complémentaires de développement (Cascading, Scalding, Flink)
Outils complémentaires d'analyse (RHadoop, Hama, Chukwa, Kafka)
Installation et configuration
Installation en mode distribué
Configuration du cluster et de l'environnement
Etude des fichiers de configuration (core-site.xml / hdfs-site.xml / mapred-site.xml / yarn-site.xml / capacity-scheduler.xml)
Création des users pour les daemons HDFS et YARN (Droits d'accès sur les exécutables et répertoires)
Lancement des services (Démarrage des composants : HDFS, hadoop-daemon, yarn-daemon )
Gestion de la grappe, différentes méthodes (Ligne de commandes, API Rest, Serveur http intégré, APIs natives)
Exemples en ligne de commandes avec HDFS, YARN, MapRed
Présentation des fonctions offertes par le serveur http
Travaux pratiques (Organisation et configuration d'une grappe hadoop)
Configuration du cluster et de l'environnement
Etude des fichiers de configuration (core-site.xml / hdfs-site.xml / mapred-site.xml / yarn-site.xml / capacity-scheduler.xml)
Création des users pour les daemons HDFS et YARN (Droits d'accès sur les exécutables et répertoires)
Lancement des services (Démarrage des composants : HDFS, hadoop-daemon, yarn-daemon )
Gestion de la grappe, différentes méthodes (Ligne de commandes, API Rest, Serveur http intégré, APIs natives)
Exemples en ligne de commandes avec HDFS, YARN, MapRed
Présentation des fonctions offertes par le serveur http
Travaux pratiques (Organisation et configuration d'une grappe hadoop)
Administration Hadoop
Outils complémentaires à YARN et HDFS (jConsole, jConsole YARN, Exemples sur le suivi de charges, l'analyse des journaux)
Principe de gestion des noeuds
Principe des accès JMX (Démonstration avec Prometheus)
Administration HDFS (Présentation des outils de stockage des fichiers, fsck, dfsadmin, Mise en oeuvre sur des exemples simples de récupération de fichiers)
Gestion centralisée de caches avec Cacheadmin (Déplacement d'un NameNode, Mise en mode maintenance, Gestion de la file d'attente, paramétrage, capacity-scheduler)
Principe de gestion des noeuds
Principe des accès JMX (Démonstration avec Prometheus)
Administration HDFS (Présentation des outils de stockage des fichiers, fsck, dfsadmin, Mise en oeuvre sur des exemples simples de récupération de fichiers)
Gestion centralisée de caches avec Cacheadmin (Déplacement d'un NameNode, Mise en mode maintenance, Gestion de la file d'attente, paramétrage, capacity-scheduler)
Haute disponibilité
Mise en place de la haute disponibilité sur une distribution Ambari
Travaux pratiques (Passage d'un système HDFS en mode HA, Explication/démonstration d'une fédération de cluster Hadoop)
Travaux pratiques (Passage d'un système HDFS en mode HA, Explication/démonstration d'une fédération de cluster Hadoop)
Sécurité
Mécanismes de sécurité et mise en oeuvre pratique de la sécurité avec Kerberos
Travaux pratiques (Mise en place de la sécurité Kerberos sur une distribution Ambari, Création des utilisateurs, Travaux sur les droits d'accès et les droits d'exécution, Impact au niveau des files de traitement YARN)
Sécurisation de YARN avec les Linux Container Executor
Travaux pratiques (Mise en place de la sécurité Kerberos sur une distribution Ambari, Création des utilisateurs, Travaux sur les droits d'accès et les droits d'exécution, Impact au niveau des files de traitement YARN)
Sécurisation de YARN avec les Linux Container Executor
Exploitation
Installation d'une grappe Hadoop avec Ambari (Tableau de bord, Lancement des services, Principe de la supervision des éléments par le NodeManager)
Monitoring graphique avec Ambari (Présentation de Ganglia, Kibana)
Travaux pratiques (Visualisation des alertes en cas d'indisponibilité d'un noeud, Configuration des logs avec log4j)
Monitoring graphique avec Ambari (Présentation de Ganglia, Kibana)
Travaux pratiques (Visualisation des alertes en cas d'indisponibilité d'un noeud, Configuration des logs avec log4j)
dates des formations a grenoble
dates des formations a SOPHIA ANTIPOLIS
formations associées
- Apache Flink
- Flux de données avec Storm
- Blockchain : Mise en pratique
- Apache Pig : Développement de scripts
- Apache Cassandra : Administration
- BIG DATA Gestion et pilotage de projets
- BIG DATA Architecture et technologies
- BIG DATA Hadoop Infrastructure sécurisée
- BIG DATA Cassandra
- BIG DATA Hadoop - Lécosysteme
- BIG DATA Elastic Stack : Présentation
- BIG DATA Hadoop Stockage avec HBase
- BIG DATA Elastic Stack pour administrateurs
- BIG DATA Intégration SQL, Hive, SparkDataFrames
- BIG DATA Hadoop Cloudera Administration
- BIG DATA Kafka : Ingestion et traitement de messages
- BIG DATA NEO4J Graphes et analyse
- BIG DATA Hadoop Développement
- BIG DATA Hadoop EMR
- BIG DATA Programmation R et intégration Big Data
- BIG DATA Spark : Traitement de données
- BIG DATA Supervision
- BIG DATA La synthèse