
Formation Spark ML
Domaine : Data Science – Deep learning
DURÉE
2.0 jour(s)
OBJECTIFS
Savoir mettre en oeuvre les outils de Machine Learning sur Spark. Savoir créer des modèles et les exploiter.
Pré-requis
Connaissance d'un langage de programmation comme Python, Java ou Scala.
Participants
Chef de projets, architecte.
coût
Nous contacter pour une formation sur mesure ou en intra
LIEUx de formation
Notre centre de formation à GrenobleNotre centre de formation à MoiransNotre centre de formation à Sophia Antipolis
Sur votre site en formation intraEn classe distancielle
PROGRAMME DE FORMATION
Spark ML
Introduction
Rappels sur Spark (Principe de fonctionnement, Langages supportés)
DataFrames
Objectifs (Traitement de données structurées, API DataSet et DataFrames)
Optimisation des requêtes (Mise en oeuvre des DataFrames et DataSet)
Chargement de données, pré-traitement (Standardisation, Transformations non linéaires, Discrétisation)
Génération de données
Optimisation des requêtes (Mise en oeuvre des DataFrames et DataSet)
Chargement de données, pré-traitement (Standardisation, Transformations non linéaires, Discrétisation)
Génération de données
Traitements statistiques de base
Introduction aux calculs statistiques (Paramétrisation des fonctions)
Applications aux fermes de calculs distribués (Problématiques induites, Approximations, Précision des estimations)
Exemples sur Spark : Calculs distribués de base (Moyennes, variances, écart-type, asymétrie et aplatissement (skewness/kurtosis))
Applications aux fermes de calculs distribués (Problématiques induites, Approximations, Précision des estimations)
Exemples sur Spark : Calculs distribués de base (Moyennes, variances, écart-type, asymétrie et aplatissement (skewness/kurtosis))
Machine Learning
Apprentissage automatique (Définition, Attentes par rapport au Machine Learning)
Les valeurs d'observation et les variables cibles (Ingénierie des variables)
Les méthodes (Apprentissage supervisé et non supervisé, Classification, régression)
Fonctionnalités (Machine Learning avec Spark, Algorithmes standards, Gestion de la persistence, Statistiques)
Les valeurs d'observation et les variables cibles (Ingénierie des variables)
Les méthodes (Apprentissage supervisé et non supervisé, Classification, régression)
Fonctionnalités (Machine Learning avec Spark, Algorithmes standards, Gestion de la persistence, Statistiques)
Mise en oeuvre sur Spark
Mise en oeuvre avec les DataFrames
Algorithmes (Régression linéaire, k-moyennes, k-voisins, Classification naïve bayésienne, Arbres de décisions, Forêts aléatoires)
Création de jeux d'essai (Entraînement et construction de modèles)
Prévisions à partir de données réelles
Travaux pratiques (Régression logistiques, Forêts aléatoires, k-moyennes)
Recommandations (recommendForAllUsers(), recommendForAllItems())
Algorithmes (Régression linéaire, k-moyennes, k-voisins, Classification naïve bayésienne, Arbres de décisions, Forêts aléatoires)
Création de jeux d'essai (Entraînement et construction de modèles)
Prévisions à partir de données réelles
Travaux pratiques (Régression logistiques, Forêts aléatoires, k-moyennes)
Recommandations (recommendForAllUsers(), recommendForAllItems())
Modèles
Chargement et enregistrement de modèles
Mesure de l'efficacité des algorithmes (Courbes ROC, MulticlassClassificationEvaluator())
Mesure de performance (Descente de gradient)
Modification des hyper-paramètres
Application pratique avec les courbes d'évaluations
Mesure de l'efficacité des algorithmes (Courbes ROC, MulticlassClassificationEvaluator())
Mesure de performance (Descente de gradient)
Modification des hyper-paramètres
Application pratique avec les courbes d'évaluations
Spark/GraphX
Gestion de graphes orientés sur Spark
Fourniture d'algorithmes (Opérateurs simples pour des calculs statistiques sur les graphes)
Travaux pratiques (Exemples d'opérations sur les graphes)
Fourniture d'algorithmes (Opérateurs simples pour des calculs statistiques sur les graphes)
Travaux pratiques (Exemples d'opérations sur les graphes)
IA
Introduction aux réseaux de neurones
Les types de couches (Convolution, pooling et pertes)
L'approche du Deep Learning avec Spark
Les types de couches (Convolution, pooling et pertes)
L'approche du Deep Learning avec Spark
dates des formations a grenoble
dates des formations a SOPHIA ANTIPOLIS
formations associées