Formations informatiques à Grenoble et Sophia Antipolis

Formation Natural Language Processing : NLP, RAG et LLM avec Python

Objectifs

Définir les concepts clés du pipeline NLP/Rag.

Expliquer les différences et complémentarités entre recherche lexicale, recherche vectorielle et recherche hybride.

Mettre en oeuvre un prétraitement texte et produire une représentation exploitable dans un script Python.

Analyser les résultats d'un moteur de recherche pour identifier les causes de performance.

Evaluer un système RAG en distinguant les métriques de retrieval de celles de génération et en interprétant les résultats pour prioriser des améliorations.

Concevoir un pipeline RAG robuste répondant à un besoin QA documentaire.

Déployer une API Python propre exposant les fonctionnalités NLP/RAG, prête à être intégrée dans une application.

Pré-requis

Avoir les bases de programmation Python

Participants

Analystes de corpus basés sur du texte

Programme de formation

Natural Language Processing : NLP, RAG et LLM avec Python

NLP sans IA générative : Traitement de texte "classique mais efficace"

  1. NLP différente de LLM : panorama raisonné

  2. Chaîne NLP traditionnelle

  3. Tokenisation

  4. Lemmatisation / stemming : quand c'est utile (ou pas)

  5. Nettoyage texte (regex, unicode, accents, bruit)

  6. Statistiques lexicales

  7. Construction

  8. Cas réel : Recherche simple dans un corpus documentaire

NLP sans IA générative : Rechercher textuelle et scoring

  1. Recherche lexicale

  2. Similarité cosine / dot product

  3. Limites du "full lexical"

  4. Introduction aux embeddings, sans magie

  5. Comparaison résultats humains VS scores

  6. Analye des erreurs (mots manquants, synonymes)

RAG : Embeddings & retrieval (le coeur du RAG)

  1. Embeddings différent de LLM génératif

  2. Métriques vectorielles

  3. Chunking

  4. Pourquoi le chunking est plus critique que le modèle

  5. Génération d'embeddings

  6. Index vectoriel

  7. Recherche top-k

  8. Analyse des faux positifs

  9. Comparaison

RAG hybride (la bonne pratique)

  1. RAG naïf VS RAG robuste

  2. Hybrid search

  3. Re-ranking

  4. Gestion des sources

  5. Anti-hallucinations structurelles

  6. Pipeline

  7. Retour

LLM minimalistes & Prompting utile

  1. Rôle raisonnable d'un LLM en RAG

  2. Prompting déterministe

  3. JSON, citations, contraintes

  4. Pourquoi le fine-tuning est souvent inutile en RAG

  5. Passage retrieved -> réponse structurée

  6. Ajout

  7. Comparaison

Durée
3 jours
Lieux
Meylan Moirans Sophia Dans vos locaux Classe distancielle
Groupe de 8 personnes maximum
Demandez un devis
Cette thématique vous intéresse ?
Nos experts conçoivent votre formation sur-mesure On adore les moutons à 5 pattes !
Formations dans la même thématique