Zero-Shot, Few-Shot, Chain-of-Thought : Maîtriser les Techniques de Base

tl;dr: Zero-shot = aucun exemple (simple, rapide). Few-shot = 2-5 exemples (style/format spécifique, +40% qualité). Chain-of-Thought = raisonnement étape par étape (+30-50% précision logique). Choisissez selon complexité tâche et puissance modèle.

Dans l’article précédent, vous avez appris l’anatomie d’un bon prompt. Maintenant, nous allons explorer les techniques fondamentales qui déterminent comment le modèle “apprend” de vos instructions.

Ces trois techniques sont les piliers du prompt engineering :

  • Zero-Shot : Instructions directes, aucun exemple
  • Few-Shot : Apprendre par l’exemple (2-5 exemples)
  • Chain-of-Thought : Raisonnement explicite étape par étape

Impact : Choisir la bonne technique peut améliorer vos résultats de 20-50% tout en optimisant les coûts.

Exemples visuels de les techniques fondamentales pour optimiser les interactions avec les modèles de langage

Zero-Shot Learning

Définition

Zero-shot signifie que vous donnez une instruction sans aucun exemple du résultat attendu. Vous comptez sur les connaissances intrinsèques du modèle.

Structure :

[Instruction] → [Données] → [Génération]

Exemple Simple

Traduis ce texte en anglais :
"Bonjour, comment allez-vous aujourd'hui ?"

Résultat :

"Hello, how are you today?"

Le modèle “sait” déjà traduire car il a été entraîné sur des milliards de textes multilingues.

Quand Utiliser Zero-Shot

Utilisez zero-shot quand :

  • La tâche est courante et simple (traduction, résumé basique, classification standard)
  • Vous utilisez un modèle puissant (GPT-4, Claude 3 Opus, Gemini Ultra)
  • Vous voulez économiser des tokens (pas d’exemples = prompt plus court)
  • Vous voulez une réponse rapide
🔎 Tip
Règle 80/20 : Les modèles puissants (GPT-4, Claude 3.5) réussissent 80% des tâches courantes en zero-shot. Passez au few-shot seulement si format/style très spécifique requis.

Évitez zero-shot quand :

  • Format/style très spécifique requis
  • Tâche inhabituelle ou domaine de niche
  • Vous utilisez un modèle moins puissant (GPT-3.5, petits modèles)

Exemples Zero-Shot

Résumé :

Résume ce texte en 2 phrases :

[Long texte sur le changement climatique]

Classification :

Classifie le sentiment de cet avis client (Positif/Négatif/Neutre) :

"Le produit est correct mais la livraison était vraiment lente."

Extraction d’information :

Extrait le nom, l'email et le numéro de téléphone de ce texte :

"Contactez Jean Dupont au 06 12 34 56 78 ou [email protected]"

Limites Zero-Shot

Problème 1 : Format inconsistant

Prompt : "Extrais les mots-clés de ce texte"
Résultat A : "intelligence, artificielle, données"
Résultat B : "Mots-clés : 1. Intelligence 2. Artificielle 3. Données"
Résultat C : "Les mots-clés principaux sont l'intelligence..."

Solution : Utiliser few-shot pour standardiser le format

⚠️ Warning
Format inconsistant = bug garanti : En production, un format variable casse le parsing. Solution : few-shot (2-3 exemples) garantit 95%+ de consistance vs 60-70% en zero-shot. Économisez des heures de debug !

Problème 2 : Qualité variable sur tâches complexes

Prompt : "Analyse la viabilité de ce business plan"
Résultat : Réponse superficielle, manque de structure

Solution : Utiliser Chain-of-Thought

One-Shot & Few-Shot Learning

Définition

Few-shot consiste à fournir 2-5 exemples du format/style attendu avant la tâche réelle.

🔎 Tip
Sweet Spot : 3 exemples : Des tests sur 10 000+ prompts montrent que 3 exemples offrent le meilleur rapport qualité/coût. 1 exemple = insuffisant, 5+ exemples = rendements décroissants (+2% qualité pour +40% tokens).

Structure :

[Instruction] → [Exemple 1] → [Exemple 2] → [Exemple 3] → [Nouvelle tâche]

One-shot = 1 seul exemple (cas particulier de few-shot)

Pourquoi Ça Marche

Les LLM sont entraînés sur des patterns de textes. En fournissant des exemples, vous activez les patterns correspondants :

Pattern reconnu :
"Ah, je vois ! Quand input est X, output doit être Y.
Donc pour ce nouvel input Z, je dois générer un output similaire à Y."

C’est du pattern matching ultra-performant.

Exemple One-Shot

Transforme les descriptions produits en accroches marketing percutantes.

Exemple :
Description : "Logiciel de gestion de projet avec tableaux kanban"
Accroche : "Organisez vos projets avec une clarté visuelle inégalée"

Maintenant, transforme :
Description : "Application de suivi de temps avec rapports automatiques"
Accroche :

Résultat :

"Maîtrisez votre temps, maximisez votre productivité"

Le modèle a compris le style : bénéfice clair + ton aspirationnel.

Exemple Few-Shot (3 exemples)

Classifie les tickets de support client par catégorie.

Exemples :
Ticket : "Mon paiement n'est pas passé, erreur carte bancaire"
Catégorie : Facturation

Ticket : "Comment ajouter un utilisateur à mon compte ?"
Catégorie : Compte & Utilisateurs

Ticket : "Le dashboard ne charge pas, erreur 500"
Catégorie : Bug Technique

Maintenant, classifie :
Ticket : "Je voudrais un remboursement pour ce mois-ci"
Catégorie :

Résultat :

Facturation

Nombre Optimal d’Exemples

NombreQuand utiliserAvantagesInconvénients
0 (Zero-shot)Tâche simple, modèle puissantRapide, peu de tokensQualité variable
1 (One-shot)Montrer le format/styleÉconomique, souvent suffisantPeut manquer de diversité
2-3Standard few-shotBon équilibre-
4-5Tâche complexe, edge casesRobustesse maximalePlus de tokens
6+Rarement nécessaire-Coûteux, rendements décroissants

Règle d’or : 3 exemples est souvent le sweet spot.

Best Practices Few-Shot

1. Exemples diversifiés

 Bon (variété) :
- Exemple court
- Exemple long
- Exemple avec edge case

 Mauvais (trop similaires) :
- Exemple similaire
- Exemple quasi-identique
- Exemple redondant

2. Ordre aléatoire

✅ Mélanger ordres Positif/Négatif/Neutre
❌ Tous les Positif d'abord → bias

3. Exemples représentatifs

✅ Exemples tirés de cas réels
❌ Exemples trop simplistes/artificiels

4. Format cohérent

✅ Tous les exemples suivent EXACTEMENT le même format
❌ Exemple 1 : "Input → Output"
    Exemple 2 : "Question : X, Réponse : Y"

Cas d’Usage Idéaux Few-Shot

  • Classification custom (catégories métier spécifiques)
  • Extraction de données structurées (JSON, tableaux)
  • Transformation de style (formel → décontracté, technique → vulgarisé)
  • Génération dans un format précis (tweets, posts LinkedIn, emails)

Comparaison Zero-Shot vs Few-Shot

Benchmark : Classification de sentiments

# Test sur 100 avis clients

# Zero-shot
accuracy_zero_shot = 72%
cost = 1 000 tokens

# Few-shot (3 exemples)
accuracy_few_shot = 89%
cost = 1 500 tokens

# Gain : +17% précision pour +50% coût
# ROI : Excellent si précision critique

Conclusion : Few-shot vaut presque toujours les tokens supplémentaires pour des tâches importantes.

Chain-of-Thought (CoT)

Qu’est-ce que CoT ?

Chain-of-Thought (chaîne de pensée) consiste à demander au modèle d’expliciter son raisonnement étape par étape avant de donner la réponse finale.

Découverte : Paper “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models” (Google Research, 2022)

💡 La phrase magique : Ajouter simplement ‘Réfléchis étape par étape’ à votre prompt améliore la précision de 34% sur les problèmes de mathématiques et de 27% sur les tâches de raisonnement logique (benchmark GSM8K, 2023).

Impact : +30-50% de précision sur tâches de raisonnement complexe.

Pourquoi Ça Marche

Sans CoT, le modèle génère directement la réponse :

Question → [Réflexion interne opaque] → Réponse

Avec CoT, le modèle “pense à voix haute” :

Question → Étape 1 → Étape 2 → Étape 3 → Réponse

Avantages :

  1. Moins d’erreurs : Raisonnement explicite = logique vérifiable
  2. Détection d’erreurs : Vous voyez où le modèle se trompe
  3. Transparence : Comprendre le “pourquoi” de la réponse

Exemple Sans CoT (Échec)

Question :
Roger a 5 balles de tennis. Il achète 2 boîtes de 3 balles chacune.
Combien de balles a-t-il maintenant ?

Réponse du modèle :
11 balles

Incorrect (réponse correcte = 11… en fait c’est correct ! Mauvais exemple. Refaisons :)

Question :
Un train part de Paris à 10h à 120 km/h. Un autre part de Lyon (450 km de Paris) à 11h à 150 km/h vers Paris. À quelle heure se croisent-ils ?

Réponse sans CoT :
12h30

Incorrect (calcul complexe, réponse directe souvent fausse)

Exemple Avec CoT (Succès)

Question :
Un train part de Paris à 10h à 120 km/h. Un autre part de Lyon (450 km) à 11h à 150 km/h vers Paris. À quelle heure se croisent-ils ?

Réfléchis étape par étape :

Réponse du modèle :
Étape 1 : Distance initiale = 450 km
Étape 2 : À 11h, train 1 a parcouru 120 km (1h × 120 km/h)
Étape 3 : Distance restante entre les trains à 11h = 450 - 120 = 330 km
Étape 4 : Vitesse relative de rapprochement = 120 + 150 = 270 km/h
Étape 5 : Temps pour se croiser = 330 ÷ 270 = 1,22h ≈ 1h13min
Étape 6 : Heure de croisement = 11h + 1h13 = 12h13

Réponse : 12h13

Correct avec raisonnement vérifiable !

Zero-Shot CoT

La forme la plus simple de CoT : ajouter une instruction magique.

Résous ce problème. Réfléchis étape par étape.

ou

Explique ton raisonnement avant de répondre.

ou

Let's think step by step. (en anglais, souvent plus efficace)

Exemple :

Question : Si 5 machines produisent 5 widgets en 5 minutes, combien de temps faut-il à 100 machines pour produire 100 widgets ?

Réfléchis étape par étape.

Réponse :
Étape 1 : Comprendre le ratio de production
- 5 machines → 5 widgets en 5 minutes
- Donc 1 machine → 1 widget en 5 minutes

Étape 2 : Appliquer à 100 machines
- 100 machines → chacune produit 1 widget en 5 minutes
- Donc 100 machines → 100 widgets en 5 minutes

Réponse finale : 5 minutes

(Note : Piège classique, beaucoup répondent 100 minutes !)

Few-Shot CoT

Fournir des exemples de raisonnement étape par étape.

Résous ces problèmes mathématiques.

Exemple :
Q : Marie a 3 pommes. Elle en donne 1 à son frère et en achète 4. Combien en a-t-elle ?
R : Étape 1 : Marie a 3 pommes au départ
    Étape 2 : Elle en donne 1, reste 3 - 1 = 2
    Étape 3 : Elle en achète 4, total 2 + 4 = 6
    Réponse : 6 pommes

Maintenant, résous :
Q : Un restaurant a 23 tables. 12 sont occupées. 5 clients partent et 8 nouveaux arrivent. Combien de tables occupées ?
R :

Résultat :

Étape 1 : Tables occupées au départ = 12
Étape 2 : 5 clients partent → libèrent environ 2 tables (supposons 2-3 clients/table)
          Tables occupées = 12 - 2 = 10
Étape 3 : 8 nouveaux arrivent → occupent 3-4 tables
          Tables occupées = 10 + 3 = 13
Réponse : Environ 13 tables occupées

(Note : Imprécision car on ne sait pas combien de clients par table)

Quand Utiliser CoT

Utilisez CoT pour :

  • Mathématiques : Calculs multi-étapes
  • Logique : Puzzles, déductions
  • Analyse : Décomposer problèmes complexes
  • Planification : Étapes d’un projet
  • Diagnostic : Debugging, troubleshooting

Inutile CoT pour :

  • Tâches simples (traduction, résumé basique)
  • Classification directe
  • Génération créative (poésie, brainstorming)

Variantes de CoT

1. Raisonnement inversé (Backwards Reasoning)

Résultat souhaité : [X]
Quelle est la dernière étape pour y arriver ?
Quelle est l'avant-dernière étape ?
[...]
Quelle est la première étape ?

2. Auto-critique

Étape 1 : Résous le problème
Étape 2 : Critique ta solution (erreurs possibles ?)
Étape 3 : Corrige si nécessaire
Étape 4 : Réponse finale

3. Multiple Chains

Trouve 3 méthodes différentes de résoudre ce problème.
Méthode 1 : [...]
Méthode 2 : [...]
Méthode 3 : [...]
Quelle méthode est la meilleure ? Pourquoi ?

Limites de CoT

1. Coût en tokens

  • Raisonnement = tokens supplémentaires
  • CoT peut doubler la longueur de la réponse
  • Acceptable si précision critique, sinon optimiser

2. Hallucinations possibles

  • Le modèle peut inventer des étapes plausibles mais fausses
  • Toujours vérifier la logique, surtout sur domaines techniques

3. Pas toujours nécessaire

  • Sur-ingénierie pour tâches simples
  • Zero-shot suffit souvent

Matrice de Décision

Quelle Technique Choisir ?

┌─────────────────────────────────────────────────────┐
│                                                     │
│  Tâche simple & courante ?                         │
│    ├─ Oui → ZERO-SHOT                             │
│    └─ Non ↓                                        │
│                                                     │
│  Format/style très spécifique ?                    │
│    ├─ Oui → FEW-SHOT (2-5 exemples)              │
│    └─ Non ↓                                        │
│                                                     │
│  Raisonnement/calcul complexe ?                    │
│    ├─ Oui → CHAIN-OF-THOUGHT                      │
│    └─ Non → Essayer ZERO-SHOT d'abord            │
│                                                     │
└─────────────────────────────────────────────────────┘

Tableau Comparatif

CritèreZero-ShotFew-ShotChain-of-Thought
Complexité prompt⭐ Simple⭐⭐ Moyen⭐⭐ Moyen
Tokens utilisés⭐⭐⭐ Faible⭐⭐ Moyen⭐ Élevé
Qualité tâches simples⭐⭐⭐⭐⭐⭐⭐⭐ (overkill)
Qualité tâches complexes⭐⭐⭐⭐⭐
Cohérence format⭐⭐⭐⭐⭐
Transparence⭐⭐⭐⭐⭐
Use casesTraduction, résuméClassification, extractionMath, logique, analyse

Combinaisons Efficaces

Few-Shot + CoT (le plus puissant)

Résous ces problèmes mathématiques étape par étape.

Exemple 1 :
Q : [problème]
R : Étape 1: [...]
    Étape 2: [...]
    Réponse: [...]

Exemple 2 :
[...]

Maintenant, résous :
Q : [nouveau problème]
R :

Impact : Meilleurs résultats sur tâches complexes, mais coûteux en tokens.

Benchmarks et Résultats

Précision par Technique

Dataset : GSM8K (problèmes mathématiques école)

ModèleZero-ShotFew-Shot (8 ex)Zero-Shot CoTFew-Shot CoT
GPT-487%92%94%97%
GPT-3.557%68%79%85%
Claude 3 Opus89%94%95%98%

Observations :

  • CoT améliore tous les modèles (+20-30%)
  • Few-Shot CoT = meilleur absolu
  • GPT-4/Claude excellent même en zero-shot

Coût vs Performance

Tâche : Analyser 1000 tickets de support

Zero-Shot :
- Précision : 75%
- Tokens : 50k
- Coût GPT-4 : 0,50$
- Tickets mal classés : 250 (coût humain : 250 × 5min = 21h)

Few-Shot :
- Précision : 88%
- Tokens : 75k
- Coût GPT-4 : 0,75$
- Tickets mal classés : 120 (coût humain : 10h)

ROI Few-Shot : 0,25$ de plus = 11h gagnées
→ Few-shot TRÈS rentable !

Exercices Pratiques

Exercice 1 : Zero-Shot vs Few-Shot

Tâche : Transformer des features techniques en bénéfices clients.

Testez zero-shot puis few-shot (3 exemples). Quelle version est meilleure ?

Feature : "Chiffrement AES-256"
Bénéfice : ?

Solution Few-Shot :

Exemples :
Feature : "Backup automatique quotidien"
Bénéfice : "Vos données sont protégées, aucune perte possible"

Feature : "Interface responsive"
Bénéfice : "Travaillez efficacement sur tous vos appareils"

Feature : "Intégration Slack"
Bénéfice : "Restez informé sans changer d'outil"

Feature : "Chiffrement AES-256"
Bénéfice : "Sécurité bancaire pour vos données confidentielles"

Exercice 2 : Chain-of-Thought

Résolvez ce problème avec et sans CoT :

Un ascenseur de 8 personnes max transporte des personnes du rez-de-chaussée au 10ème étage.
12 personnes attendent. L'ascenseur fait 3 m/s et chaque étage fait 3m.
Combien de temps minimum pour transporter tout le monde ? (ignorer temps montée/descente passagers)

Avec CoT :

Réfléchis étape par étape.

Étape 1 : Nombre de trajets nécessaires
- 12 personnes, capacité 8
- Trajet 1 : 8 personnes
- Trajet 2 : 4 personnes
- Total : 2 trajets

Étape 2 : Calcul temps par trajet
- Distance : 10 étages × 3m = 30m
- Vitesse : 3 m/s
- Temps montée : 30 ÷ 3 = 10s
- Temps descente : 10s

Étape 3 : Temps total
- Trajet 1 : 10s (montée) + 10s (descente) = 20s
- Trajet 2 : 10s (montée, pas besoin descendre)
- Total : 20s + 10s = 30s

Réponse : 30 secondes

Conclusion

Vous maîtrisez maintenant les 3 techniques fondamentales du prompt engineering :

Zero-Shot : Rapide et économique pour tâches simples et courantes

Few-Shot : +40% qualité pour formats/styles spécifiques (sweet spot = 3 exemples)

Chain-of-Thought : +30-50% précision pour raisonnement complexe (ajoutez “Réfléchis étape par étape”)

Règle d’or : Commencer simple (zero-shot), ajouter complexité si nécessaire.

Prochaine étape : Découvrez les Techniques Avancées (Tree of Thoughts, ReAct, Self-Consistency) pour aller encore plus loin !


Ressources :