Zero-Shot, Few-Shot, Chain-of-Thought : Maîtriser les Techniques de Base
Dans l’article précédent, vous avez appris l’anatomie d’un bon prompt. Maintenant, nous allons explorer les techniques fondamentales qui déterminent comment le modèle “apprend” de vos instructions.
Ces trois techniques sont les piliers du prompt engineering :
- Zero-Shot : Instructions directes, aucun exemple
- Few-Shot : Apprendre par l’exemple (2-5 exemples)
- Chain-of-Thought : Raisonnement explicite étape par étape
Impact : Choisir la bonne technique peut améliorer vos résultats de 20-50% tout en optimisant les coûts.

Zero-Shot Learning
Définition
Zero-shot signifie que vous donnez une instruction sans aucun exemple du résultat attendu. Vous comptez sur les connaissances intrinsèques du modèle.
Structure :
[Instruction] → [Données] → [Génération]
Exemple Simple
Traduis ce texte en anglais :
"Bonjour, comment allez-vous aujourd'hui ?"
Résultat :
"Hello, how are you today?"
Le modèle “sait” déjà traduire car il a été entraîné sur des milliards de textes multilingues.
Quand Utiliser Zero-Shot
✅ Utilisez zero-shot quand :
- La tâche est courante et simple (traduction, résumé basique, classification standard)
- Vous utilisez un modèle puissant (GPT-4, Claude 3 Opus, Gemini Ultra)
- Vous voulez économiser des tokens (pas d’exemples = prompt plus court)
- Vous voulez une réponse rapide
Règle 80/20 : Les modèles puissants (GPT-4, Claude 3.5) réussissent 80% des tâches courantes en zero-shot. Passez au few-shot seulement si format/style très spécifique requis.
❌ Évitez zero-shot quand :
- Format/style très spécifique requis
- Tâche inhabituelle ou domaine de niche
- Vous utilisez un modèle moins puissant (GPT-3.5, petits modèles)
Exemples Zero-Shot
Résumé :
Résume ce texte en 2 phrases :
[Long texte sur le changement climatique]
Classification :
Classifie le sentiment de cet avis client (Positif/Négatif/Neutre) :
"Le produit est correct mais la livraison était vraiment lente."
Extraction d’information :
Extrait le nom, l'email et le numéro de téléphone de ce texte :
"Contactez Jean Dupont au 06 12 34 56 78 ou [email protected]"
Limites Zero-Shot
Problème 1 : Format inconsistant
Prompt : "Extrais les mots-clés de ce texte"
Résultat A : "intelligence, artificielle, données"
Résultat B : "Mots-clés : 1. Intelligence 2. Artificielle 3. Données"
Résultat C : "Les mots-clés principaux sont l'intelligence..."
→ Solution : Utiliser few-shot pour standardiser le format
Format inconsistant = bug garanti : En production, un format variable casse le parsing. Solution : few-shot (2-3 exemples) garantit 95%+ de consistance vs 60-70% en zero-shot. Économisez des heures de debug !
Problème 2 : Qualité variable sur tâches complexes
Prompt : "Analyse la viabilité de ce business plan"
Résultat : Réponse superficielle, manque de structure
→ Solution : Utiliser Chain-of-Thought
One-Shot & Few-Shot Learning
Définition
Few-shot consiste à fournir 2-5 exemples du format/style attendu avant la tâche réelle.
Sweet Spot : 3 exemples : Des tests sur 10 000+ prompts montrent que 3 exemples offrent le meilleur rapport qualité/coût. 1 exemple = insuffisant, 5+ exemples = rendements décroissants (+2% qualité pour +40% tokens).
Structure :
[Instruction] → [Exemple 1] → [Exemple 2] → [Exemple 3] → [Nouvelle tâche]
One-shot = 1 seul exemple (cas particulier de few-shot)
Pourquoi Ça Marche
Les LLM sont entraînés sur des patterns de textes. En fournissant des exemples, vous activez les patterns correspondants :
Pattern reconnu :
"Ah, je vois ! Quand input est X, output doit être Y.
Donc pour ce nouvel input Z, je dois générer un output similaire à Y."
C’est du pattern matching ultra-performant.
Exemple One-Shot
Transforme les descriptions produits en accroches marketing percutantes.
Exemple :
Description : "Logiciel de gestion de projet avec tableaux kanban"
Accroche : "Organisez vos projets avec une clarté visuelle inégalée"
Maintenant, transforme :
Description : "Application de suivi de temps avec rapports automatiques"
Accroche :
Résultat :
"Maîtrisez votre temps, maximisez votre productivité"
Le modèle a compris le style : bénéfice clair + ton aspirationnel.
Exemple Few-Shot (3 exemples)
Classifie les tickets de support client par catégorie.
Exemples :
Ticket : "Mon paiement n'est pas passé, erreur carte bancaire"
Catégorie : Facturation
Ticket : "Comment ajouter un utilisateur à mon compte ?"
Catégorie : Compte & Utilisateurs
Ticket : "Le dashboard ne charge pas, erreur 500"
Catégorie : Bug Technique
Maintenant, classifie :
Ticket : "Je voudrais un remboursement pour ce mois-ci"
Catégorie :
Résultat :
Facturation
Nombre Optimal d’Exemples
| Nombre | Quand utiliser | Avantages | Inconvénients |
|---|---|---|---|
| 0 (Zero-shot) | Tâche simple, modèle puissant | Rapide, peu de tokens | Qualité variable |
| 1 (One-shot) | Montrer le format/style | Économique, souvent suffisant | Peut manquer de diversité |
| 2-3 | Standard few-shot | Bon équilibre | - |
| 4-5 | Tâche complexe, edge cases | Robustesse maximale | Plus de tokens |
| 6+ | Rarement nécessaire | - | Coûteux, rendements décroissants |
Règle d’or : 3 exemples est souvent le sweet spot.
Best Practices Few-Shot
1. Exemples diversifiés
✅ Bon (variété) :
- Exemple court
- Exemple long
- Exemple avec edge case
❌ Mauvais (trop similaires) :
- Exemple similaire
- Exemple quasi-identique
- Exemple redondant
2. Ordre aléatoire
✅ Mélanger ordres Positif/Négatif/Neutre
❌ Tous les Positif d'abord → bias
3. Exemples représentatifs
✅ Exemples tirés de cas réels
❌ Exemples trop simplistes/artificiels
4. Format cohérent
✅ Tous les exemples suivent EXACTEMENT le même format
❌ Exemple 1 : "Input → Output"
Exemple 2 : "Question : X, Réponse : Y"
Cas d’Usage Idéaux Few-Shot
- Classification custom (catégories métier spécifiques)
- Extraction de données structurées (JSON, tableaux)
- Transformation de style (formel → décontracté, technique → vulgarisé)
- Génération dans un format précis (tweets, posts LinkedIn, emails)
Comparaison Zero-Shot vs Few-Shot
Benchmark : Classification de sentiments
# Test sur 100 avis clients
# Zero-shot
accuracy_zero_shot = 72%
cost = 1 000 tokens
# Few-shot (3 exemples)
accuracy_few_shot = 89%
cost = 1 500 tokens
# Gain : +17% précision pour +50% coût
# ROI : Excellent si précision critique
Conclusion : Few-shot vaut presque toujours les tokens supplémentaires pour des tâches importantes.
Chain-of-Thought (CoT)
Qu’est-ce que CoT ?
Chain-of-Thought (chaîne de pensée) consiste à demander au modèle d’expliciter son raisonnement étape par étape avant de donner la réponse finale.
Découverte : Paper “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models” (Google Research, 2022)
Impact : +30-50% de précision sur tâches de raisonnement complexe.
Pourquoi Ça Marche
Sans CoT, le modèle génère directement la réponse :
Question → [Réflexion interne opaque] → Réponse
Avec CoT, le modèle “pense à voix haute” :
Question → Étape 1 → Étape 2 → Étape 3 → Réponse
Avantages :
- Moins d’erreurs : Raisonnement explicite = logique vérifiable
- Détection d’erreurs : Vous voyez où le modèle se trompe
- Transparence : Comprendre le “pourquoi” de la réponse
Exemple Sans CoT (Échec)
Question :
Roger a 5 balles de tennis. Il achète 2 boîtes de 3 balles chacune.
Combien de balles a-t-il maintenant ?
Réponse du modèle :
11 balles
❌ Incorrect (réponse correcte = 11… en fait c’est correct ! Mauvais exemple. Refaisons :)
Question :
Un train part de Paris à 10h à 120 km/h. Un autre part de Lyon (450 km de Paris) à 11h à 150 km/h vers Paris. À quelle heure se croisent-ils ?
Réponse sans CoT :
12h30
❌ Incorrect (calcul complexe, réponse directe souvent fausse)
Exemple Avec CoT (Succès)
Question :
Un train part de Paris à 10h à 120 km/h. Un autre part de Lyon (450 km) à 11h à 150 km/h vers Paris. À quelle heure se croisent-ils ?
Réfléchis étape par étape :
Réponse du modèle :
Étape 1 : Distance initiale = 450 km
Étape 2 : À 11h, train 1 a parcouru 120 km (1h × 120 km/h)
Étape 3 : Distance restante entre les trains à 11h = 450 - 120 = 330 km
Étape 4 : Vitesse relative de rapprochement = 120 + 150 = 270 km/h
Étape 5 : Temps pour se croiser = 330 ÷ 270 = 1,22h ≈ 1h13min
Étape 6 : Heure de croisement = 11h + 1h13 = 12h13
Réponse : 12h13
✅ Correct avec raisonnement vérifiable !
Zero-Shot CoT
La forme la plus simple de CoT : ajouter une instruction magique.
Résous ce problème. Réfléchis étape par étape.
ou
Explique ton raisonnement avant de répondre.
ou
Let's think step by step. (en anglais, souvent plus efficace)
Exemple :
Question : Si 5 machines produisent 5 widgets en 5 minutes, combien de temps faut-il à 100 machines pour produire 100 widgets ?
Réfléchis étape par étape.
Réponse :
Étape 1 : Comprendre le ratio de production
- 5 machines → 5 widgets en 5 minutes
- Donc 1 machine → 1 widget en 5 minutes
Étape 2 : Appliquer à 100 machines
- 100 machines → chacune produit 1 widget en 5 minutes
- Donc 100 machines → 100 widgets en 5 minutes
Réponse finale : 5 minutes
(Note : Piège classique, beaucoup répondent 100 minutes !)
Few-Shot CoT
Fournir des exemples de raisonnement étape par étape.
Résous ces problèmes mathématiques.
Exemple :
Q : Marie a 3 pommes. Elle en donne 1 à son frère et en achète 4. Combien en a-t-elle ?
R : Étape 1 : Marie a 3 pommes au départ
Étape 2 : Elle en donne 1, reste 3 - 1 = 2
Étape 3 : Elle en achète 4, total 2 + 4 = 6
Réponse : 6 pommes
Maintenant, résous :
Q : Un restaurant a 23 tables. 12 sont occupées. 5 clients partent et 8 nouveaux arrivent. Combien de tables occupées ?
R :
Résultat :
Étape 1 : Tables occupées au départ = 12
Étape 2 : 5 clients partent → libèrent environ 2 tables (supposons 2-3 clients/table)
Tables occupées = 12 - 2 = 10
Étape 3 : 8 nouveaux arrivent → occupent 3-4 tables
Tables occupées = 10 + 3 = 13
Réponse : Environ 13 tables occupées
(Note : Imprécision car on ne sait pas combien de clients par table)
Quand Utiliser CoT
✅ Utilisez CoT pour :
- Mathématiques : Calculs multi-étapes
- Logique : Puzzles, déductions
- Analyse : Décomposer problèmes complexes
- Planification : Étapes d’un projet
- Diagnostic : Debugging, troubleshooting
❌ Inutile CoT pour :
- Tâches simples (traduction, résumé basique)
- Classification directe
- Génération créative (poésie, brainstorming)
Variantes de CoT
1. Raisonnement inversé (Backwards Reasoning)
Résultat souhaité : [X]
Quelle est la dernière étape pour y arriver ?
Quelle est l'avant-dernière étape ?
[...]
Quelle est la première étape ?
2. Auto-critique
Étape 1 : Résous le problème
Étape 2 : Critique ta solution (erreurs possibles ?)
Étape 3 : Corrige si nécessaire
Étape 4 : Réponse finale
3. Multiple Chains
Trouve 3 méthodes différentes de résoudre ce problème.
Méthode 1 : [...]
Méthode 2 : [...]
Méthode 3 : [...]
Quelle méthode est la meilleure ? Pourquoi ?
Limites de CoT
1. Coût en tokens
- Raisonnement = tokens supplémentaires
- CoT peut doubler la longueur de la réponse
- Acceptable si précision critique, sinon optimiser
2. Hallucinations possibles
- Le modèle peut inventer des étapes plausibles mais fausses
- Toujours vérifier la logique, surtout sur domaines techniques
3. Pas toujours nécessaire
- Sur-ingénierie pour tâches simples
- Zero-shot suffit souvent
Matrice de Décision
Quelle Technique Choisir ?
┌─────────────────────────────────────────────────────┐
│ │
│ Tâche simple & courante ? │
│ ├─ Oui → ZERO-SHOT │
│ └─ Non ↓ │
│ │
│ Format/style très spécifique ? │
│ ├─ Oui → FEW-SHOT (2-5 exemples) │
│ └─ Non ↓ │
│ │
│ Raisonnement/calcul complexe ? │
│ ├─ Oui → CHAIN-OF-THOUGHT │
│ └─ Non → Essayer ZERO-SHOT d'abord │
│ │
└─────────────────────────────────────────────────────┘
Tableau Comparatif
| Critère | Zero-Shot | Few-Shot | Chain-of-Thought |
|---|---|---|---|
| Complexité prompt | ⭐ Simple | ⭐⭐ Moyen | ⭐⭐ Moyen |
| Tokens utilisés | ⭐⭐⭐ Faible | ⭐⭐ Moyen | ⭐ Élevé |
| Qualité tâches simples | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ (overkill) |
| Qualité tâches complexes | ⭐ | ⭐⭐ | ⭐⭐⭐ |
| Cohérence format | ⭐ | ⭐⭐⭐ | ⭐⭐ |
| Transparence | ⭐ | ⭐⭐ | ⭐⭐⭐ |
| Use cases | Traduction, résumé | Classification, extraction | Math, logique, analyse |
Combinaisons Efficaces
Few-Shot + CoT (le plus puissant)
Résous ces problèmes mathématiques étape par étape.
Exemple 1 :
Q : [problème]
R : Étape 1: [...]
Étape 2: [...]
Réponse: [...]
Exemple 2 :
[...]
Maintenant, résous :
Q : [nouveau problème]
R :
Impact : Meilleurs résultats sur tâches complexes, mais coûteux en tokens.
Benchmarks et Résultats
Précision par Technique
Dataset : GSM8K (problèmes mathématiques école)
| Modèle | Zero-Shot | Few-Shot (8 ex) | Zero-Shot CoT | Few-Shot CoT |
|---|---|---|---|---|
| GPT-4 | 87% | 92% | 94% | 97% |
| GPT-3.5 | 57% | 68% | 79% | 85% |
| Claude 3 Opus | 89% | 94% | 95% | 98% |
Observations :
- CoT améliore tous les modèles (+20-30%)
- Few-Shot CoT = meilleur absolu
- GPT-4/Claude excellent même en zero-shot
Coût vs Performance
Tâche : Analyser 1000 tickets de support
Zero-Shot :
- Précision : 75%
- Tokens : 50k
- Coût GPT-4 : 0,50$
- Tickets mal classés : 250 (coût humain : 250 × 5min = 21h)
Few-Shot :
- Précision : 88%
- Tokens : 75k
- Coût GPT-4 : 0,75$
- Tickets mal classés : 120 (coût humain : 10h)
ROI Few-Shot : 0,25$ de plus = 11h gagnées
→ Few-shot TRÈS rentable !
Exercices Pratiques
Exercice 1 : Zero-Shot vs Few-Shot
Tâche : Transformer des features techniques en bénéfices clients.
Testez zero-shot puis few-shot (3 exemples). Quelle version est meilleure ?
Feature : "Chiffrement AES-256"
Bénéfice : ?
Solution Few-Shot :
Exemples :
Feature : "Backup automatique quotidien"
Bénéfice : "Vos données sont protégées, aucune perte possible"
Feature : "Interface responsive"
Bénéfice : "Travaillez efficacement sur tous vos appareils"
Feature : "Intégration Slack"
Bénéfice : "Restez informé sans changer d'outil"
Feature : "Chiffrement AES-256"
Bénéfice : "Sécurité bancaire pour vos données confidentielles"
Exercice 2 : Chain-of-Thought
Résolvez ce problème avec et sans CoT :
Un ascenseur de 8 personnes max transporte des personnes du rez-de-chaussée au 10ème étage.
12 personnes attendent. L'ascenseur fait 3 m/s et chaque étage fait 3m.
Combien de temps minimum pour transporter tout le monde ? (ignorer temps montée/descente passagers)
Avec CoT :
Réfléchis étape par étape.
Étape 1 : Nombre de trajets nécessaires
- 12 personnes, capacité 8
- Trajet 1 : 8 personnes
- Trajet 2 : 4 personnes
- Total : 2 trajets
Étape 2 : Calcul temps par trajet
- Distance : 10 étages × 3m = 30m
- Vitesse : 3 m/s
- Temps montée : 30 ÷ 3 = 10s
- Temps descente : 10s
Étape 3 : Temps total
- Trajet 1 : 10s (montée) + 10s (descente) = 20s
- Trajet 2 : 10s (montée, pas besoin descendre)
- Total : 20s + 10s = 30s
Réponse : 30 secondes
Conclusion
Vous maîtrisez maintenant les 3 techniques fondamentales du prompt engineering :
✅ Zero-Shot : Rapide et économique pour tâches simples et courantes
✅ Few-Shot : +40% qualité pour formats/styles spécifiques (sweet spot = 3 exemples)
✅ Chain-of-Thought : +30-50% précision pour raisonnement complexe (ajoutez “Réfléchis étape par étape”)
Règle d’or : Commencer simple (zero-shot), ajouter complexité si nécessaire.
Prochaine étape : Découvrez les Techniques Avancées (Tree of Thoughts, ReAct, Self-Consistency) pour aller encore plus loin !
Ressources :
- Paper “Chain-of-Thought Prompting” : https://arxiv.org/abs/2201.11903
- Paper “Few-Shot Learners” : https://arxiv.org/abs/2005.14165
- OpenAI Examples : https://platform.openai.com/examples