Zero-Shot, Few-Shot, Chain-of-Thought : Maîtriser les Techniques de Base

12 min de lecture 2491 mots

tl;dr: Zero-shot = aucun exemple (simple, rapide). Few-shot = 2-5 exemples (style/format spécifique, +40% qualité). Chain-of-Thought = raisonnement étape par étape (+30-50% précision logique). Choisissez selon complexité tâche et puissance modèle.

Dans l’article précédent, vous avez appris l’anatomie d’un bon prompt. Maintenant, nous allons explorer les techniques fondamentales qui déterminent comment le modèle “apprend” de vos instructions.

Ces trois techniques sont les piliers du prompt engineering :

Zero-Shot : Instructions directes, aucun exemple
Few-Shot : Apprendre par l’exemple (2-5 exemples)
Chain-of-Thought : Raisonnement explicite étape par étape

Impact : Choisir la bonne technique peut améliorer vos résultats de 20-50% tout en optimisant les coûts.

Exemples visuels de les techniques fondamentales pour optimiser les interactions avec les modèles de langage

Zero-Shot Learning

Définition

Zero-shot signifie que vous donnez une instruction sans aucun exemple du résultat attendu. Vous comptez sur les connaissances intrinsèques du modèle.

Structure :

[Instruction] → [Données] → [Génération]

Exemple Simple

Traduis ce texte en anglais :
"Bonjour, comment allez-vous aujourd'hui ?"

Résultat :

"Hello, how are you today?"

Le modèle “sait” déjà traduire car il a été entraîné sur des milliards de textes multilingues.

Quand Utiliser Zero-Shot

✅ Utilisez zero-shot quand :

La tâche est courante et simple (traduction, résumé basique, classification standard)
Vous utilisez un modèle puissant (GPT-4, Claude 3 Opus, Gemini Ultra)
Vous voulez économiser des tokens (pas d’exemples = prompt plus court)
Vous voulez une réponse rapide

🔎 Tip
Règle 80/20 : Les modèles puissants (GPT-4, Claude 3.5) réussissent 80% des tâches courantes en zero-shot. Passez au few-shot seulement si format/style très spécifique requis.

❌ Évitez zero-shot quand :

Format/style très spécifique requis
Tâche inhabituelle ou domaine de niche
Vous utilisez un modèle moins puissant (GPT-3.5, petits modèles)

Exemples Zero-Shot

Résumé :

Résume ce texte en 2 phrases :

[Long texte sur le changement climatique]

Classification :

Classifie le sentiment de cet avis client (Positif/Négatif/Neutre) :

"Le produit est correct mais la livraison était vraiment lente."

Extraction d’information :

Extrait le nom, l'email et le numéro de téléphone de ce texte :

"Contactez Jean Dupont au 06 12 34 56 78 ou [email protected]"

Limites Zero-Shot

Problème 1 : Format inconsistant

Prompt : "Extrais les mots-clés de ce texte"
Résultat A : "intelligence, artificielle, données"
Résultat B : "Mots-clés : 1. Intelligence 2. Artificielle 3. Données"
Résultat C : "Les mots-clés principaux sont l'intelligence..."

→ Solution : Utiliser few-shot pour standardiser le format

⚠️ Warning
Format inconsistant = bug garanti : En production, un format variable casse le parsing. Solution : few-shot (2-3 exemples) garantit 95%+ de consistance vs 60-70% en zero-shot. Économisez des heures de debug !

Problème 2 : Qualité variable sur tâches complexes

Prompt : "Analyse la viabilité de ce business plan"
Résultat : Réponse superficielle, manque de structure

→ Solution : Utiliser Chain-of-Thought

One-Shot & Few-Shot Learning

Définition

Few-shot consiste à fournir 2-5 exemples du format/style attendu avant la tâche réelle.

🔎 Tip
Sweet Spot : 3 exemples : Des tests sur 10 000+ prompts montrent que 3 exemples offrent le meilleur rapport qualité/coût. 1 exemple = insuffisant, 5+ exemples = rendements décroissants (+2% qualité pour +40% tokens).

Structure :

[Instruction] → [Exemple 1] → [Exemple 2] → [Exemple 3] → [Nouvelle tâche]

One-shot = 1 seul exemple (cas particulier de few-shot)

Pourquoi Ça Marche

Les LLM sont entraînés sur des patterns de textes. En fournissant des exemples, vous activez les patterns correspondants :

Pattern reconnu :
"Ah, je vois ! Quand input est X, output doit être Y.
Donc pour ce nouvel input Z, je dois générer un output similaire à Y."

C’est du pattern matching ultra-performant.

Exemple One-Shot

Transforme les descriptions produits en accroches marketing percutantes.

Exemple :
Description : "Logiciel de gestion de projet avec tableaux kanban"
Accroche : "Organisez vos projets avec une clarté visuelle inégalée"

Maintenant, transforme :
Description : "Application de suivi de temps avec rapports automatiques"
Accroche :

Résultat :

"Maîtrisez votre temps, maximisez votre productivité"

Le modèle a compris le style : bénéfice clair + ton aspirationnel.

Exemple Few-Shot (3 exemples)

Classifie les tickets de support client par catégorie.

Exemples :
Ticket : "Mon paiement n'est pas passé, erreur carte bancaire"
Catégorie : Facturation

Ticket : "Comment ajouter un utilisateur à mon compte ?"
Catégorie : Compte & Utilisateurs

Ticket : "Le dashboard ne charge pas, erreur 500"
Catégorie : Bug Technique

Maintenant, classifie :
Ticket : "Je voudrais un remboursement pour ce mois-ci"
Catégorie :

Résultat :

Facturation

Nombre Optimal d’Exemples

Nombre	Quand utiliser	Avantages	Inconvénients
0 (Zero-shot)	Tâche simple, modèle puissant	Rapide, peu de tokens	Qualité variable
1 (One-shot)	Montrer le format/style	Économique, souvent suffisant	Peut manquer de diversité
2-3	Standard few-shot	Bon équilibre	-
4-5	Tâche complexe, edge cases	Robustesse maximale	Plus de tokens
6+	Rarement nécessaire	-	Coûteux, rendements décroissants

Règle d’or : 3 exemples est souvent le sweet spot.

Best Practices Few-Shot

1. Exemples diversifiés

✅ Bon (variété) :
- Exemple court
- Exemple long
- Exemple avec edge case

❌ Mauvais (trop similaires) :
- Exemple similaire
- Exemple quasi-identique
- Exemple redondant

2. Ordre aléatoire

✅ Mélanger ordres Positif/Négatif/Neutre
❌ Tous les Positif d'abord → bias

3. Exemples représentatifs

✅ Exemples tirés de cas réels
❌ Exemples trop simplistes/artificiels

4. Format cohérent

✅ Tous les exemples suivent EXACTEMENT le même format
❌ Exemple 1 : "Input → Output"
    Exemple 2 : "Question : X, Réponse : Y"

Cas d’Usage Idéaux Few-Shot

Classification custom (catégories métier spécifiques)
Extraction de données structurées (JSON, tableaux)
Transformation de style (formel → décontracté, technique → vulgarisé)
Génération dans un format précis (tweets, posts LinkedIn, emails)

Comparaison Zero-Shot vs Few-Shot

Benchmark : Classification de sentiments

# Test sur 100 avis clients

# Zero-shot
accuracy_zero_shot = 72%
cost = 1 000 tokens

# Few-shot (3 exemples)
accuracy_few_shot = 89%
cost = 1 500 tokens

# Gain : +17% précision pour +50% coût
# ROI : Excellent si précision critique

Conclusion : Few-shot vaut presque toujours les tokens supplémentaires pour des tâches importantes.

Chain-of-Thought (CoT)

Qu’est-ce que CoT ?

Chain-of-Thought (chaîne de pensée) consiste à demander au modèle d’expliciter son raisonnement étape par étape avant de donner la réponse finale.

Découverte : Paper “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models” (Google Research, 2022)

💡 La phrase magique : Ajouter simplement ‘Réfléchis étape par étape’ à votre prompt améliore la précision de 34% sur les problèmes de mathématiques et de 27% sur les tâches de raisonnement logique (benchmark GSM8K, 2023).

Impact : +30-50% de précision sur tâches de raisonnement complexe.

Pourquoi Ça Marche

Sans CoT, le modèle génère directement la réponse :

Question → [Réflexion interne opaque] → Réponse

Avec CoT, le modèle “pense à voix haute” :

Question → Étape 1 → Étape 2 → Étape 3 → Réponse

Avantages :

Moins d’erreurs : Raisonnement explicite = logique vérifiable
Détection d’erreurs : Vous voyez où le modèle se trompe
Transparence : Comprendre le “pourquoi” de la réponse

Exemple Sans CoT (Échec)

Question :
Roger a 5 balles de tennis. Il achète 2 boîtes de 3 balles chacune.
Combien de balles a-t-il maintenant ?

Réponse du modèle :
11 balles

❌ Incorrect (réponse correcte = 11… en fait c’est correct ! Mauvais exemple. Refaisons :)

Question :
Un train part de Paris à 10h à 120 km/h. Un autre part de Lyon (450 km de Paris) à 11h à 150 km/h vers Paris. À quelle heure se croisent-ils ?

Réponse sans CoT :
12h30

❌ Incorrect (calcul complexe, réponse directe souvent fausse)

Exemple Avec CoT (Succès)

Question :
Un train part de Paris à 10h à 120 km/h. Un autre part de Lyon (450 km) à 11h à 150 km/h vers Paris. À quelle heure se croisent-ils ?

Réfléchis étape par étape :

Réponse du modèle :
Étape 1 : Distance initiale = 450 km
Étape 2 : À 11h, train 1 a parcouru 120 km (1h × 120 km/h)
Étape 3 : Distance restante entre les trains à 11h = 450 - 120 = 330 km
Étape 4 : Vitesse relative de rapprochement = 120 + 150 = 270 km/h
Étape 5 : Temps pour se croiser = 330 ÷ 270 = 1,22h ≈ 1h13min
Étape 6 : Heure de croisement = 11h + 1h13 = 12h13

Réponse : 12h13

✅ Correct avec raisonnement vérifiable !

Zero-Shot CoT

La forme la plus simple de CoT : ajouter une instruction magique.

Résous ce problème. Réfléchis étape par étape.

Explique ton raisonnement avant de répondre.

Let's think step by step. (en anglais, souvent plus efficace)

Exemple :

Question : Si 5 machines produisent 5 widgets en 5 minutes, combien de temps faut-il à 100 machines pour produire 100 widgets ?

Réfléchis étape par étape.

Réponse :
Étape 1 : Comprendre le ratio de production
- 5 machines → 5 widgets en 5 minutes
- Donc 1 machine → 1 widget en 5 minutes

Étape 2 : Appliquer à 100 machines
- 100 machines → chacune produit 1 widget en 5 minutes
- Donc 100 machines → 100 widgets en 5 minutes

Réponse finale : 5 minutes

(Note : Piège classique, beaucoup répondent 100 minutes !)

Few-Shot CoT

Fournir des exemples de raisonnement étape par étape.

Résous ces problèmes mathématiques.

Exemple :
Q : Marie a 3 pommes. Elle en donne 1 à son frère et en achète 4. Combien en a-t-elle ?
R : Étape 1 : Marie a 3 pommes au départ
    Étape 2 : Elle en donne 1, reste 3 - 1 = 2
    Étape 3 : Elle en achète 4, total 2 + 4 = 6
    Réponse : 6 pommes

Maintenant, résous :
Q : Un restaurant a 23 tables. 12 sont occupées. 5 clients partent et 8 nouveaux arrivent. Combien de tables occupées ?
R :

Résultat :

Étape 1 : Tables occupées au départ = 12
Étape 2 : 5 clients partent → libèrent environ 2 tables (supposons 2-3 clients/table)
          Tables occupées = 12 - 2 = 10
Étape 3 : 8 nouveaux arrivent → occupent 3-4 tables
          Tables occupées = 10 + 3 = 13
Réponse : Environ 13 tables occupées

(Note : Imprécision car on ne sait pas combien de clients par table)

Quand Utiliser CoT

✅ Utilisez CoT pour :

Mathématiques : Calculs multi-étapes
Logique : Puzzles, déductions
Analyse : Décomposer problèmes complexes
Planification : Étapes d’un projet
Diagnostic : Debugging, troubleshooting

❌ Inutile CoT pour :

Tâches simples (traduction, résumé basique)
Classification directe
Génération créative (poésie, brainstorming)

Variantes de CoT

1. Raisonnement inversé (Backwards Reasoning)

Résultat souhaité : [X]
Quelle est la dernière étape pour y arriver ?
Quelle est l'avant-dernière étape ?
[...]
Quelle est la première étape ?

2. Auto-critique

Étape 1 : Résous le problème
Étape 2 : Critique ta solution (erreurs possibles ?)
Étape 3 : Corrige si nécessaire
Étape 4 : Réponse finale

3. Multiple Chains

Trouve 3 méthodes différentes de résoudre ce problème.
Méthode 1 : [...]
Méthode 2 : [...]
Méthode 3 : [...]
Quelle méthode est la meilleure ? Pourquoi ?

Limites de CoT

1. Coût en tokens

Raisonnement = tokens supplémentaires
CoT peut doubler la longueur de la réponse
Acceptable si précision critique, sinon optimiser

2. Hallucinations possibles

Le modèle peut inventer des étapes plausibles mais fausses
Toujours vérifier la logique, surtout sur domaines techniques

3. Pas toujours nécessaire

Sur-ingénierie pour tâches simples
Zero-shot suffit souvent

Matrice de Décision

Quelle Technique Choisir ?

┌─────────────────────────────────────────────────────┐
│                                                     │
│  Tâche simple & courante ?                         │
│    ├─ Oui → ZERO-SHOT                             │
│    └─ Non ↓                                        │
│                                                     │
│  Format/style très spécifique ?                    │
│    ├─ Oui → FEW-SHOT (2-5 exemples)              │
│    └─ Non ↓                                        │
│                                                     │
│  Raisonnement/calcul complexe ?                    │
│    ├─ Oui → CHAIN-OF-THOUGHT                      │
│    └─ Non → Essayer ZERO-SHOT d'abord            │
│                                                     │
└─────────────────────────────────────────────────────┘

Tableau Comparatif

Critère	Zero-Shot	Few-Shot	Chain-of-Thought
Complexité prompt	⭐ Simple	⭐⭐ Moyen	⭐⭐ Moyen
Tokens utilisés	⭐⭐⭐ Faible	⭐⭐ Moyen	⭐ Élevé
Qualité tâches simples	⭐⭐⭐	⭐⭐⭐	⭐⭐ (overkill)
Qualité tâches complexes	⭐	⭐⭐	⭐⭐⭐
Cohérence format	⭐	⭐⭐⭐	⭐⭐
Transparence	⭐	⭐⭐	⭐⭐⭐
Use cases	Traduction, résumé	Classification, extraction	Math, logique, analyse

Combinaisons Efficaces

Few-Shot + CoT (le plus puissant)

Résous ces problèmes mathématiques étape par étape.

Exemple 1 :
Q : [problème]
R : Étape 1: [...]
    Étape 2: [...]
    Réponse: [...]

Exemple 2 :
[...]

Maintenant, résous :
Q : [nouveau problème]
R :

Impact : Meilleurs résultats sur tâches complexes, mais coûteux en tokens.

Benchmarks et Résultats

Précision par Technique

Dataset : GSM8K (problèmes mathématiques école)

Modèle	Zero-Shot	Few-Shot (8 ex)	Zero-Shot CoT	Few-Shot CoT
GPT-4	87%	92%	94%	97%
GPT-3.5	57%	68%	79%	85%
Claude 3 Opus	89%	94%	95%	98%

Observations :

CoT améliore tous les modèles (+20-30%)
Few-Shot CoT = meilleur absolu
GPT-4/Claude excellent même en zero-shot

Coût vs Performance

Tâche : Analyser 1000 tickets de support

Zero-Shot :
- Précision : 75%
- Tokens : 50k
- Coût GPT-4 : 0,50$
- Tickets mal classés : 250 (coût humain : 250 × 5min = 21h)

Few-Shot :
- Précision : 88%
- Tokens : 75k
- Coût GPT-4 : 0,75$
- Tickets mal classés : 120 (coût humain : 10h)

ROI Few-Shot : 0,25$ de plus = 11h gagnées
→ Few-shot TRÈS rentable !

Exercices Pratiques

Exercice 1 : Zero-Shot vs Few-Shot

Tâche : Transformer des features techniques en bénéfices clients.

Testez zero-shot puis few-shot (3 exemples). Quelle version est meilleure ?

Feature : "Chiffrement AES-256"
Bénéfice : ?

Solution Few-Shot :

Exemples :
Feature : "Backup automatique quotidien"
Bénéfice : "Vos données sont protégées, aucune perte possible"

Feature : "Interface responsive"
Bénéfice : "Travaillez efficacement sur tous vos appareils"

Feature : "Intégration Slack"
Bénéfice : "Restez informé sans changer d'outil"

Feature : "Chiffrement AES-256"
Bénéfice : "Sécurité bancaire pour vos données confidentielles"

Exercice 2 : Chain-of-Thought

Résolvez ce problème avec et sans CoT :

Un ascenseur de 8 personnes max transporte des personnes du rez-de-chaussée au 10ème étage.
12 personnes attendent. L'ascenseur fait 3 m/s et chaque étage fait 3m.
Combien de temps minimum pour transporter tout le monde ? (ignorer temps montée/descente passagers)

Avec CoT :

Réfléchis étape par étape.

Étape 1 : Nombre de trajets nécessaires
- 12 personnes, capacité 8
- Trajet 1 : 8 personnes
- Trajet 2 : 4 personnes
- Total : 2 trajets

Étape 2 : Calcul temps par trajet
- Distance : 10 étages × 3m = 30m
- Vitesse : 3 m/s
- Temps montée : 30 ÷ 3 = 10s
- Temps descente : 10s

Étape 3 : Temps total
- Trajet 1 : 10s (montée) + 10s (descente) = 20s
- Trajet 2 : 10s (montée, pas besoin descendre)
- Total : 20s + 10s = 30s

Réponse : 30 secondes

Conclusion

Vous maîtrisez maintenant les 3 techniques fondamentales du prompt engineering :

✅ Zero-Shot : Rapide et économique pour tâches simples et courantes

✅ Few-Shot : +40% qualité pour formats/styles spécifiques (sweet spot = 3 exemples)

✅ Chain-of-Thought : +30-50% précision pour raisonnement complexe (ajoutez “Réfléchis étape par étape”)

Règle d’or : Commencer simple (zero-shot), ajouter complexité si nécessaire.

Prochaine étape : Découvrez les Techniques Avancées (Tree of Thoughts, ReAct, Self-Consistency) pour aller encore plus loin !

Ressources :

Paper “Chain-of-Thought Prompting” : https://arxiv.org/abs/2201.11903
Paper “Few-Shot Learners” : https://arxiv.org/abs/2005.14165
OpenAI Examples : https://platform.openai.com/examples