Cursus

Créer son agent IA personnalisé avec des outils no-code Créer son propre agent IA avec les LLMs open source Prompt Engineering avec ChatGPT Niveau 2 Maîtriser le Dialogue Engineering avec les IA génératives

Formation Créer son propre agent IA avec les LLMs open source

Durée : 2 jours

Objectifs

Comprendre le fonctionnement des modèles de langage open source (LLMs).

Installer et interagir avec un modèle type Mistral, LLaMA ou GPT-J via HuggingFace.

Construire un agent conversationnel autonome avec prompt chaining et RAG.

Déployer une interface interactive (local ou via app web simple).

Pré-requis

Maîtrise de Python, environnement virtuel, gestion de packages

Participants

Développeurs, data scientists, ingénieurs IA, formateurs techniques

Programme de formation

Créer son propre agent IA avec les LLMs open source

Introduction aux LLMs open source

Enjeux de souveraineté et d'indépendance technologique
Comparatif
- Mistral
- LLaMA
- Falcon
- GPT-J...
Avantages, limites, licences d'usage (Apache 2,0, MIT...)
Choix selon objectifs
- Taille
- Performance
- Contraintes hardware

Génération en local ou via API

Utilisation de HuggingFace Hub pour déploiement rapide
Différences entre API distante (Inference API) et inférence locale
Benchmarks de performance sur pormpts standards (temps, cohérence, coût)

Aspects matériels : CPU, GPU, quantization

Importance de la RAM, VRAM et de l'optimisation mémoire
Formats de modèles
- FP32
- INT8
- GGUF
- Quantization à la volée
Usage de serveurs, colab ou modèles en local

Bibliothèque Transformers (HuggingFace)

Chargement de modèles
- AutoModelForCausalLM
- AutoTokenizer
Gestion des batchs, sampling, temperature, top-p, top-k
Tokenization : spécificités des modèles (Byte Pair Encoding, SentencePiece...)

Prompt Engineering avancé

Structure d'un prompt efficace
- Consignes
- Style
- Format attendu
Définition de rôles (système de consignes persistantes)
Paramétrage de température et comportement selon le ton

Chaining de prompts

Construction d'enchaînements logiques (task chaining, output <-> input)
Structuration de flux
- Agent décisionnel
- Etapes séquentielles

Mémoire à court terme

Gestion d'un historique de conversation
Mécanisme de buffer, résumé automatique, context compression
Usage de ConversationSummaryMemory ou de mémoires locales

Gestion du contexte et des tokens

Calcul de la taille de contexte maximale selon modèle
Troncature intelligente, compression ou sélection sémantique
Réduction de charge contextuelle via embeddings

Introduction au RAG (Retrieval Augmented Generation)

Intérêt : pallier la méconnaissance du modèle par adjonction documentaire
Architecture : embed -> store -> retrieve -> generate
Cas d'usage (FAX interne, support produit, base réglementaire)

Encodage de documents

Sentence Transformers
- all-MiniLM
- mpnet
- bge
- multilingual
Vectorisation texte brut, PDF, site web ou base structurée
Nettoyage des données, splitting optimal

Indexation dans une base vectorielle

Choix d'index
- FAISS (Facebook)
- ChromaDB
- Weaviate
Création de bases persistantes, configuration de la similarité
Recherche vectorielle
- top-k
- score de similarité
- hybridation

Récupération et génération conditionnée

Pipeline de RAG : retrieve -> rerank -> prompt final
Prompt enrichi vs prompt structuré (template + contenu injecté)
Optimisation

intra sur-mesure webinaire

Durée

2 jours

Lieux

Meylan Moirans Sophia Dans vos locaux Classe distancielle

Groupe de 8 personnes maximum

Demandez un devis

Cette thématique vous intéresse ?
Nos experts conçoivent votre formation sur-mesure On adore les moutons à 5 pattes !

Demandez un devis

Cette thématique se prête parfaitement au format Webinaire.
Nous concevons
votre solution sur-mesure.

Demandez un devis

Formations dans la même thématique

Concevoir et lancer son Chatbot 2 jours Créer son propre agent IA conversationnel (avec ChatGPT, Gemini & autres) 1 jour Créer un RAG no-code 2 jours Natural Language Processing : NLP, RAG et LLM avec Python 3 jours RAG et Fine Tuning d'un LLM 3 jours