
Formation BIG DATA Cassandra
Domaine : Data Science – Deep learning
DURÉE
3.0 jour(s)
OBJECTIFS
Connaître les apports de Cassandra, savoir l’installer et le configurer. Maîtriser CQL. Administrer et sécuriser un cluster Cassandra. Effectuer des calculs distribués avec Spark.
Pré-requis
Connaissance générale sur les bases de données.
Participants
Chef de projet, gestionnaire de bases de données.
coût
Nous contacter pour une formation sur mesure ou en intra
LIEUx de formation
Notre centre de formation à GrenobleNotre centre de formation à MoiransNotre centre de formation à Sophia Antipolis
Sur votre site en formation intraEn classe distancielle
PROGRAMME DE FORMATION
BIG DATA Cassandra
Introduction
Historique, fonctionnalités de Cassandra, licence
Format des données ("key-value", Traitement de volumes importants, Haute disponibilité, Système réparti de base de données)
Format des données ("key-value", Traitement de volumes importants, Haute disponibilité, Système réparti de base de données)
Installation et configuration
Prérequis (Plateformes supportées, Etude du fichier de configuration (conf/cassandra.yaml))
Répertoire de travail
Répertoire de stockage des données
Gestion de la mémoire
Démarrage d'un noeud et test de l'interface cliente cqlsh
Répertoire de travail
Répertoire de stockage des données
Gestion de la mémoire
Démarrage d'un noeud et test de l'interface cliente cqlsh
CQL
Commandes de base (Connexion au système de base de données)
Création de colonnes (Insertion, modification, recherche)
Le CQL (Cassandra Query Language) (Exécution de scripts, Comment écrire des requêtes ?, Approches)
Limitations du CQL
Création de colonnes (Insertion, modification, recherche)
Le CQL (Cassandra Query Language) (Exécution de scripts, Comment écrire des requêtes ?, Approches)
Limitations du CQL
Gestion de la grappe
Principe (Préparation du premier noeud : adresse d'écoute, Configuration de nouveaux noeuds, Notion de bootstrapping et de token)
Paramètres listen_address et rpc_address
Réplication (Topologie du réseau et EndpointSnitch, Stratégie de réplication, Ajout de noeuds, suppression)
Architecture de stockage mémoire et disque dur (Gestion des tombstones, bloom-filter)
Travaux pratiques (Mise en place d'une configuration de production (multi-datacenters, multi-racks))
Paramètres listen_address et rpc_address
Réplication (Topologie du réseau et EndpointSnitch, Stratégie de réplication, Ajout de noeuds, suppression)
Architecture de stockage mémoire et disque dur (Gestion des tombstones, bloom-filter)
Travaux pratiques (Mise en place d'une configuration de production (multi-datacenters, multi-racks))
Supervision
OpsCenter (Installation, lancement et découverte)
Supervision avec nodetool cfstats
Principes des accès JMX (Exports JMX vers des outils de supervision comme Nagios)
Démonstration avec Prometheus et Kibana
Supervision avec nodetool cfstats
Principes des accès JMX (Exports JMX vers des outils de supervision comme Nagios)
Démonstration avec Prometheus et Kibana
Exploitation
Gestion des noeuds Cassandra
Sauvegardes, snapshots et export au format JSON
Principe de cohérence (digest request et read repair)
Sauvegardes, snapshots et export au format JSON
Principe de cohérence (digest request et read repair)
Support Hadoop
Principe de map/reduce
Implémentation Hadoop
Intégration Hadoop/Cassandra
Implémentation Hadoop
Intégration Hadoop/Cassandra
Support Spark
Description rapide de l'architecture Spark (Mise en oeuvre depuis Cassandra)
Exécution d'application Spark s'appuyant sur une grappe Cassandra
Exécution d'application Spark s'appuyant sur une grappe Cassandra
Performance
Outil de test de performance Cassandra-stress
Mise en place d'un plan de stress et paramétrage
Mise en place d'un plan de stress et paramétrage
dates des formations a grenoble
dates des formations a SOPHIA ANTIPOLIS
formations associées
- Apache Flink
- Flux de données avec Storm
- Blockchain : Mise en pratique
- Apache Pig : Développement de scripts
- Apache Cassandra : Administration
- BIG DATA Gestion et pilotage de projets
- BIG DATA Architecture et technologies
- BIG DATA Hadoop Infrastructure sécurisée
- BIG DATA Hadoop - Lécosysteme
- BIG DATA Elastic Stack : Présentation
- BIG DATA Hadoop Stockage avec HBase
- BIG DATA Elastic Stack pour administrateurs
- BIG DATA Intégration SQL, Hive, SparkDataFrames
- BIG DATA Hadoop Cloudera Administration
- BIG DATA Kafka : Ingestion et traitement de messages
- BIG DATA NEO4J Graphes et analyse
- BIG DATA Hadoop Développement
- BIG DATA Hadoop EMR
- BIG DATA Programmation R et intégration Big Data
- BIG DATA Hadoop Hortonworks Administration
- BIG DATA Spark : Traitement de données
- BIG DATA Supervision
- BIG DATA La synthèse