Timeline de l'IA : De 1950 à 2026, 75 Ans d'Intelligence Artificielle
L’Intelligence Artificielle a 75 ans d’histoire fascinante, entre espoirs démesurés, hivers glaciaux et percées révolutionnaires. Chronologie complète.
Ères de l’IA
L’histoire de l’IA se divise en grandes périodes :
- 1950-1956 : Fondations théoriques
- 1956-1974 : Premier été de l’IA (optimisme)
- 1974-1980 : Premier hiver (désillusion)
- 1980-1987 : Renaissance (systèmes experts)
- 1987-1993 : Second hiver
- 1993-2011 : Progrès graduel (ML classique)
- 2012-2017 : Révolution Deep Learning
- 2017-2022 : Ère des Transformers
- 2022-2025 : Explosion LLMs et IA générative

Fondations (1950-1956)
1950 : test de Turing
Alan Turing : “Computing Machinery and Intelligence”
Question : “Les machines peuvent-elles penser ?”
Test de Turing :
- Juge humain converse avec humain et machine (texte)
- Si juge ne peut distinguer → Machine “pense”
Impact : Première définition opérationnelle de l’intelligence machine.
1943 : premier neurone artificiel
Warren McCulloch & Walter Pitts : Modèle mathématique du neurone.
Équation :
y = 1 si Σ(wi × xi) > seuil
y = 0 sinon
Impact : Base des réseaux de neurones modernes.
1956 : naissance officielle de l’IA ⭐
Conférence de Dartmouth (été 1956)
Organisateurs :
- John McCarthy (invente le terme “Artificial Intelligence”)
- Marvin Minsky
- Claude Shannon
- Nathaniel Rochester
Proposition :
“Nous proposons une étude de 2 mois sur l’intelligence artificielle… basée sur la conjecture que chaque aspect de l’apprentissage peut être si précisément décrit qu’une machine peut le simuler.”
Optimisme : “Problème résolu en une génération” (spoiler : non).
Impact : Fondation du domaine, financement recherche.
Premier été de l’IA (1956-1974)
1958 : Perceptron
Frank Rosenblatt : Premier algorithme d’apprentissage automatique.
Perceptron : Neurone unique capable d’apprendre.
Démo : Mark I Perceptron (reconnaissance de formes visuelles).
Limitation : Ne peut apprendre que fonctions linéairement séparables (XOR impossible).
1966 : ELIZA - premier chatbot
Joseph Weizenbaum (MIT)
Fonctionnement : Pattern matching simple, simule psychothérapeute.
Exemple :
User: "Je suis triste"
ELIZA: "Pourquoi êtes-vous triste ?"
User: "Ma mère me déteste"
ELIZA: "Parlez-moi de votre famille"
Impact : Effet ELIZA = Humains attribuent intelligence même à système simple.
1972 : SHRDLU - compréhension langage
Terry Winograd (MIT)
Capacités : Comprendre instructions naturelles, manipuler blocs virtuels.
User: "Prends le petit cube rouge"
SHRDLU: [Exécute] "OK"
User: "Qu'est-ce qui le supporte ?"
SHRDLU: "Le gros cube vert"
Limitation : Monde ultra-simple (micro-monde), pas généralisable.
Premier hiver de l’IA (1974-1980)
1973 : rapport Lighthill (UK)
Sir James Lighthill : Rapport dévastateur pour UK Science Research Council.
Conclusion : “Progrès IA décevants, promesses non tenues.”
Conséquences :
- Coupure financements UK
- Fin programmes IA britanniques
- Pessimisme généralisé
1969 : critique Perceptrons
Marvin Minsky & Seymour Papert : Livre “Perceptrons”
Démontrent : Perceptron ne peut apprendre XOR.
Impact négatif : Recherche réseaux de neurones stagne 15 ans.
Ironie : Multi-layer perceptrons (MLP) résolvent le problème, mais ignorés jusqu’aux années 1980.
Raisons de l’hiver :
- Promesses excessives non tenues
- Limitations computationnelles (ordinateurs trop lents)
- Données insuffisantes
- Problèmes plus complexes que prévu
Renaissance (1980-1987)
1980 : systèmes experts
XCON (Digital Equipment Corporation) :
- Configure commandes ordinateurs
- Économise $40M/an
- Succès commercial majeur
MYCIN (Stanford, médical) :
- Diagnostic infections sanguines
- Performances niveau expert humain
Principe : Base de règles “if-then” codant expertise humaine.
Limites :
- Maintenance difficile (milliers de règles)
- Pas d’apprentissage automatique
- Coûteux à développer
1986 : Backpropagation
Rumelhart, Hinton & Williams : Popularisent algorithme d’apprentissage.
Révolution : Permet entraîner réseaux profonds (multi-couches).
Impact : Renaissance des réseaux de neurones.
Second hiver (1987-1993)
1987 : krach marché systèmes experts
Lisp Machines : Ordinateurs spécialisés IA deviennent obsolètes.
Raisons :
- PCs et workstations moins chers, plus puissants
- Maintenance systèmes experts coûteuse
- Promesses excessives (encore)
Conséquences : Coupures financements, pessimisme.
Progrès graduel (1993-2011)
1997 : Deep Blue bat Kasparov ⭐
IBM Deep Blue vs Garry Kasparov (champion du monde échecs)
Résultat : Deep Blue gagne 3½-2½
Méthode : Brute force (200M positions/seconde), pas ML.
Impact psychologique : “IA dépasse humains” (dans domaine limité).
1998 : MNIST dataset
Yann LeCun et al. : Dataset 70 000 chiffres manuscrits.
Impact : Benchmark standard pour tester réseaux de neurones.
LeNet-5 (LeCun) : CNN reconnaît chiffres (99% précision).
2006 : deep learning renaît
Geoffrey Hinton : “Deep Belief Networks”
Breakthrough : Méthode pré-entraînement couche par couche.
Impact : Relance recherche réseaux profonds.
2009 : ImageNet dataset
Fei-Fei Li (Stanford) : 14M images, 20 000 catégories.
ImageNet Challenge : Compétition annuelle reconnaissance d’images.
Impact : Dataset qui changera tout en 2012.
Révolution deep learning (2012-2017)
2012 : AlexNet - big bang du deep learning ⭐⭐⭐
Alex Krizhevsky, Ilya Sutskever, Geoffrey Hinton (Université de Toronto)
ImageNet 2012 : AlexNet domine avec 15.3% erreur (vs 26% second).
Architecture :
- CNN 8 couches
- 60M paramètres
- GPUs (2x GTX 580) - Crucial
Impact :
- ✅ Prouve efficacité deep learning
- ✅ Lance ruée vers deep learning
- ✅ GPUs deviennent standard IA
Après : Toutes les entreprises tech investissent massivement.
2014 : GANs (Generative Adversarial Networks)
Ian Goodfellow : Réseaux antagonistes génératifs.
Principe :
- Générateur : Crée images
- Discriminateur : Détecte faux
- Compétition → Amélioration
Impact : Base génération d’images (deepfakes, art IA).
2014 : Seq2Seq et attention
Google : Modèles séquence-à-séquence pour traduction.
Attention Mechanism (Bahdanau et al.) :
- Modèle “regarde” parties pertinentes input
- Révolutionnaire pour NLP
Impact : Précurseur des Transformers.
2015 : ResNet
Kaiming He et al. (Microsoft) : Réseaux résiduels.
Innovation : Skip connections → Permet entraîner 152+ couches.
ImageNet 2015 : 3.57% erreur (< humain : ~5%).
Impact : “IA dépasse humains” en vision.
2016 : AlphaGo bat Lee Sedol ⭐⭐⭐
DeepMind (Google) : AlphaGo
Match : 4-1 contre Lee Sedol (champion Go)
Révolution :
- Go considéré impossible pour IA (10^170 positions)
- Combine deep learning + tree search + RL
Coup 37 (game 2) : Mouvement créatif jamais vu → Beauté émergente.
Impact mondial : IA peut maîtriser complexité extrême.
2017 : Transformers - architecture révolutionnaire ⭐⭐⭐⭐⭐
Google Brain : “Attention is All You Need” (Vaswani et al.)
Innovation : Architecture basée uniquement sur attention (pas RNN).
Avantages :
- Parallélisation (entraînement plus rapide)
- Capture dépendances longues distances
- Scalable
Impact : Base de TOUS les LLMs modernes (GPT, BERT, etc.).
Voir aussi : Transformers
Ère des Transformers et LLMs (2017-2022)
2018 : BERT (Google)
Bidirectional Encoder Representations from Transformers
Innovation : Lit texte dans les deux sens (← →).
Impact : Révolutionne compréhension de texte, recherche Google.
2018 : GPT-1 (OpenAI) ⭐
Generative Pre-trained Transformer
Specs :
- 117M paramètres
- Decoder-only Transformer
- Pre-training + Fine-tuning
Résultats : Performances SOTA sur plusieurs tâches NLP.
Impact : Démontre puissance pré-entraînement généraliste.
2019 : GPT-2 (OpenAI)
Specs :
- 1.5B paramètres (13x GPT-1)
- Entraîné sur 40GB texte (WebText)
Controverse : OpenAI refuse publier (risque désinformation).
Capacités : Génération texte cohérent, zero-shot learning.
Citation célèbre :
Prompt : "Un train a déraillé à..."
GPT-2 : [Invente article complet avec détails]
2020 : GPT-3 (OpenAI) ⭐⭐⭐⭐
Specs :
- 175B paramètres (100x GPT-2)
- 45TB données
- Coût : ~$4-12M
Capacités révolutionnaires :
- Few-shot learning (apprend avec 1-10 exemples)
- Génération code
- Traduction
- Raisonnement
Impact :
- Démocratisation via API (beta)
- Startups IA explosent
- Prise de conscience grand public
Exemple :
Prompt : "Traduis en espagnol :
Bonjour → Hola
Au revoir → Adiós
Merci → [GPT-3 : Gracias]"
Zero code custom, just prompts
2020 : AlphaFold 2 (DeepMind) ⭐⭐⭐⭐⭐
Problème : Prédire structure 3D protéines (50 ans de recherche).
Résultat : Résout problème avec précision atomique.
Impact :
- Révolution biologie
- Drug discovery accéléré
- Prix Breakthrough 2022
Nature : “Problème résolu”
2021 : DALL-E (OpenAI)
Text-to-image : Génère images depuis descriptions.
Exemple :
"Un astronaute chevauchant un cheval dans style Van Gogh"
→ [Image générée]
Impact : IA créative accessible.
2021 : GitHub Copilot
OpenAI Codex + GitHub
Capacités : Autocomplete code, génère fonctions entières.
Adoption : Millions de développeurs.
Impact : IA transforme coding.
Explosion IA générative (2022-2023)
Novembre 2022 : ChatGPT ⭐⭐⭐⭐⭐⭐
OpenAI lance ChatGPT (GPT-3.5-turbo)
Croissance explosive :
- 5 jours : 1M utilisateurs
- 2 mois : 100M utilisateurs (record historique)
- 1 an : 500M+ utilisateurs
Pourquoi c’est différent :
- Interface conversationnelle intuitive
- Gratuit
- Utile immédiatement (emails, code, conseils)
Impact culturel :
- IA devient mainstream
- Médias : Couverture quotidienne
- Éducation : Crise (triche)
- Travail : Transformation
Citation :
“ChatGPT est l’iPhone moment de l’IA” - Satya Nadella (Microsoft)
2022 : Stable Diffusion
Stability AI : Modèle open source génération d’images.
vs DALL-E :
- ✅ Open source
- ✅ Runnable localement
- ✅ Personnalisable
Impact : Démocratisation art IA.
Février 2023 : Bing + ChatGPT (Microsoft)
Microsoft intègre GPT-4 dans Bing Search.
Impact : Premiers “AI wars” (Google pressé de répondre).
Mars 2023 : GPT-4 (OpenAI) ⭐⭐⭐⭐⭐
Specs :
- ~1.7T paramètres (rumeur, non confirmé)
- Multimodal (texte + images)
- Context 8K-128K tokens
Performances :
- Bar Exam : 90e percentile
- SAT Math : 89e percentile
- MMLU : 86% (vs 70% GPT-3.5)
Nouvelles capacités :
- Vision (GPT-4V)
- Raisonnement amélioré
- Moins d’hallucinations
Coût : $100-200M entraînement (estimé)
Mars 2023 : Claude (Anthropic)
Alternative à GPT-4 :
- Context 100K tokens (record)
- Constitutional AI (sécurité)
- Meilleur respect instructions
Impact : Compétition stimule innovation.
Décembre 2023 : Gemini (Google)
Gemini Ultra : Concurrent GPT-4
Innovation : Natif multimodal (texte+image+audio dès conception).
Gemini 1.5 (2024) : 1M tokens context (puis 2M).
IA en 2024-2025
2024 : Llama 3 (Meta) ⭐⭐⭐⭐
Open source : 8B, 70B, 405B paramètres
Impact : Démocratisation IA locale de qualité.
Performances : Llama 3.1 70B ≈ GPT-4 (dans certains benchmarks).
2024 : Claude 3 (Anthropic)
Famille : Haiku, Sonnet, Opus
Claude 3 Opus : Dépasse GPT-4 sur certains benchmarks.
Context : 200K tokens standard.
2024 : Sora (OpenAI)
Text-to-video : 60s vidéo réaliste.
Impact : Prochaine frontière génération contenu.
Status : Accès limité (2024).
Mai 2024 : GPT-4o (OpenAI) ⭐
“o” = omni (texte + vision + audio)
Innovation : Multimodal natif, 2x plus rapide, 50% moins cher.
Démo : Conversation audio temps réel (impressionnante).
Septembre 2024 : o1 (OpenAI) - “Strawberry”
Innovation : Reasoning model - “Pense” avant de répondre.
Méthode : Chain-of-thought intégré.
Performances :
- Math olympiades : 83e percentile
- Code : Nettement meilleur
Impact : Nouvelle direction (slow thinking vs fast).
2024 : Explosion open source
Leaders :
- Mistral AI (France) : Mixtral 8x7B, Large
- Qwen (Alibaba) : 72B excellent
- DeepSeek (Chine) : Compétitif
- Gemma (Google) : On-device
Tendance : Gap OpenAI vs Open source rétrécit (6 mois → 3 mois).
2025 : consolidation et régulation
EU AI Act : Entre en vigueur.
Tendances :
- ✅ Multimodal natif (texte+image+audio+vidéo)
- ✅ Context ultra-long (2M+ tokens)
- ✅ Reasoning models
- ✅ Agentic AI (autonomie)
- ✅ On-device AI (smartphones)
Adoption : 70% entreprises utilisent IA (vs 20% en 2022).
Métriques évolution
Taille modèles (paramètres)
| Année | Modèle | Paramètres |
|---|---|---|
| 2018 | GPT-1 | 117M |
| 2019 | GPT-2 | 1.5B |
| 2020 | GPT-3 | 175B |
| 2021 | GPT-3 Davinci | 175B |
| 2022 | PaLM (Google) | 540B |
| 2023 | GPT-4 | ~1.7T (rumeur) |
| 2024 | Llama 3.1 | 405B |
Croissance : ~100x tous les 4 ans (loi de Moore de l’IA ?).
Compute (opérations d’entraînement)
Doublement : Tous les 3-4 mois (2012-2022).
GPT-3 : ~3.14 × 10²³ FLOP
Tendance : Ralentissement (limites hardware, coûts).
Coûts
| Modèle | Coût Estimé Entraînement |
|---|---|
| GPT-2 | ~$40K |
| GPT-3 | ~$5M |
| GPT-4 | ~$100-200M |
| Gemini Ultra | ~$200M+ |
Barrière : Seuls GAFAM peuvent entraîner modèles SOTA.
Adoption grand public
| Outil | Date Lancement | 100M Utilisateurs |
|---|---|---|
| Téléphone | 1876 | 75 ans |
| Internet | 1983 | 7 ans |
| iPhone | 2007 | 6 ans |
| ChatGPT | Nov 2022 | 2 mois 🚀 |
Record absolu : ChatGPT = adoption la plus rapide de l’histoire.
Dates clés résumées
Fondation :
- 1950 : Test de Turing
- 1956 : Naissance IA (Dartmouth)
Révolutions :
- 1997 : Deep Blue bat Kasparov
- 2012 : AlexNet (deep learning)
- 2016 : AlphaGo bat Lee Sedol
- 2017 : Transformers (Google)
LLMs :
- 2018 : GPT-1
- 2020 : GPT-3
- 2022 : ChatGPT (explosion)
- 2023 : GPT-4, Claude, Gemini
- 2024 : Multimodal natif, Reasoning
Perspectives futur
2026-2030 : prédictions
Probable :
- ✅ AGI débattu (pas consensus)
- ✅ Multimodal any-to-any
- ✅ Agents IA autonomes mainstream
- ✅ On-device puissant (smartphones)
- ✅ Context illimité (mémoire externe)
Possible :
- ⚠️ AGI atteint (optimistes)
- ⚠️ Régulation stricte mondiale
- ⚠️ Nouveaux paradigmes (au-delà Transformers)
Incertain :
- ❓ Consciousness émergente ?
- ❓ Singularité technologique ?
Conclusion
75 Ans en résumé
1950-1980 : Théorie, promesses, désillusions 1980-2000 : Systèmes experts, ML classique 2000-2012 : Progrès graduel, datasets 2012-2017 : Deep learning explose 2017-2022 : Transformers dominent 2022-2025 : IA générative mainstream
Leçons de l’histoire
Cycles :
- Hype → Hiver → Percée
- Répété 3 fois
Facteurs de succès :
- Algorithmes (Transformers, backprop)
- Données (ImageNet, internet)
- Compute (GPUs, TPUs)
Prédiction : Historiquement mauvaises (optimisme excessif).
Conseil : Pragmatisme, pas hype.
Ressources historiques
Papers fondateurs :
- Turing (1950) : “Computing Machinery and Intelligence”
- Rosenblatt (1958) : “The Perceptron”
- Rumelhart et al. (1986) : “Backpropagation”
- Vaswani et al. (2017) : “Attention is All You Need”
Livres :
- “The Master Algorithm” (Pedro Domingos)
- “AI Superpowers” (Kai-Fu Lee)
- “Genius Makers” (Cade Metz) - Histoire deep learning
Documentaires :
- “AlphaGo” (Netflix)
- “The Age of AI” (YouTube Premium)
Articles connexes
Comprendre :
Acteurs :
Mythes :
Note : Cette timeline sera mise à jour régulièrement avec les nouvelles percées.