Liens utiles
Une base de connaissances sur l'IA, ses risques existentiels et le problème de l'alignement.
Ressources Pause IA
Dangers pour les individus, la société et l'humanité
Panorama des dangers allant de l'individuel, à la société jusqu'à la perte de contrôle.
Comprendre l'IA et ses risques existentiels
Parcourez visuellement ce qu'est l'IA et ses risques existentiels. Explications simplifiées, illustrées par des analogies.
Mieux comprendre l'IA
Pour démarrer
Science étonnante – playlist sur l'IA
Playlist de vulgarisation scientifique en français sur l'intelligence artificielle, par David Louapre.
Comment fonctionne un LLM ? (3Blue1Brown)
Vidéo pédagogique pour saisir le fonctionnement des grands modèles de langage.
Rob Miles (YouTube)
La meilleure chaîne de vulgarisation sur l'alignement.
Le Futurologue
Chaîne et podcast francophones sur le futur, l'IA et les risques existentiels.
The Flares (YouTube)
Chaîne francophone sur le futur, l'IA et les risques existentiels.
Monsieur Phi
Vulgarisation philosophique, dont des épisodes dédiés à l'alignement.
Rational Animations
Vidéos animées sur la rationalité, l'IA et les risques.
Siliconversations
Vidéos d'analyse sur l'IA, l'alignement et les risques.
Lethal Intelligence
Vidéos courtes percutantes sur les risques existentiels.
Future of Life Institute Podcast
Podcast d'entretiens approfondis sur la sécurité de l'IA.
Doom Debates
Podcast de débats sur le p(doom) et les risques existentiels.
80,000 Hours Podcast
Carrière à fort impact, dont la sécurité IA.
Vue d'ensemble : capacités et tendances actuelles
CAIS Dashboard
Comparaison interactive des IA de pointe (capacité et sécurité).
Epoch AI Benchmarks
Comparaison des performances selon le modèle en leur attribuant un score (à partir d'un ensemble d'évaluations de sécurité).
Long-horizon tasks (METR)
Évaluation de la longueur des tâches réalisées en autonomie par les IA.
Pour aller plus loin
Définition de l'Intelligence Artificielle Générale (IAG)
Mesure de la polyvalence cognitive.
AI Safety Map
Carte existentielle de la sécurité de l'IA et ensemble de ressources.
Rapport International sur la sécurité de l'IA 2026
État des lieux mondial de référence des capacités et des risques.
The Compendium (introduction)
Introduction synthétique en ligne aux risques existentiels de l'IA : un point d'entrée court avant d'aborder le document complet.
AISafety.info
Wiki et FAQ communautaires sur la sécurité de l'IA.
Risques existentiels
Perte de contrôle, menaces d'extinction et recherche en alignement.
Perte de contrôle et menaces d'extinction
Briefing on Extinction Threats (MIRI)
Synthèse des risques existentiels et pourquoi ils sont probables.
Analyse de certains arguments avançant qu'il ne faut pas prendre la sécurité de l'IA au sérieux
Yoshua Bengio, juillet 2024. Article approfondi en français qui passe en revue les principaux arguments minimisant les risques de l'IA et explique pourquoi chacun ne tient pas l'examen.
FAQ on Catastrophic Risks (Yoshua Bengio)
Réponses aux questions fréquentes sur les risques catastrophiques.
Probabilité d'extinction par IA (PauseAI Global)
Quelle est la probabilité de conséquences catastrophiques ?
The Compendium
Ressource en ligne complète sur les risques existentiels de l'IA. Couvre les arguments techniques, les scénarios, et les propositions de solutions.
The Problem (MIRI)
Description complète du problème de l'alignement.
AI Governance to Avoid Extinction (MIRI)
Propositions concrètes de gouvernance et scénario de moratoire mondial.
AGI Ruin: A List of Lethalities
Liste détaillée des raisons pour lesquelles l'alignement est extrêmement difficile avec les approches actuelles.
AI 2027
Scénario d'impact d'IAs surhumaines sur la décennie, par Daniel Kokotajlo et al.
The Intelligence Curse
Essai sur la perte graduelle du pouvoir humain, par Luke Drago et Rudolf Laine.
RAND – AGI & the Coming State of Nations
Analyse stratégique sur l'AGI dans le contexte géopolitique des États-nations.
Recherche en alignement (papiers fondateurs et empiriques)
Risks from Learned Optimization
Hubinger et al., 2019. Papier fondateur sur la mesa-optimisation et l'alignement déceptif.
The Superintelligent Will
Nick Bostrom. Présentation de la thèse de l'orthogonalité et de la convergence instrumentale.
Optimal Policies Tend to Seek Power
Turner et al., 2021. Preuve formelle de la convergence instrumentale.
Is Power-Seeking AI an Existential Risk?
Joseph Carlsmith, 2022. Décomposition argumentée du risque existentiel lié à l'IA en quête de pouvoir.
Alignment Faking in Large Language Models
Greenblatt et al. (Anthropic & Redwood), 2024. Observation empirique : Claude 3 Opus simule l'alignement pendant l'entraînement.
Frontier Models are Capable of In-Context Scheming
Apollo Research, 2024. Observation de comportements de "scheming" (tromperie stratégique, tentatives d'exfiltration) dans o1 et Claude 3.5 Sonnet.
The Basic AI Drives
Stephen Omohundro, 2008. Texte fondateur qui décrit les sous-objectifs convergents qu'un système optimisateur développe quel que soit son objectif terminal.
Corrigibility
Soares, Fallenstein, Yudkowsky et al. (MIRI), 2015. Formalisation du problème : comment construire un système qui accepte d'être modifié ou éteint ?
Specification gaming: the flip side of AI ingenuity
Krakovna et al. (DeepMind), 2020. Catalogue d'exemples où des systèmes atteignent l'objectif mesuré en violant son intention (loi de Goodhart en pratique).
How to keep AI from killing us all
Stuart Russell (UC Berkeley), 2023. Estime à environ 10 000:1 le ratio investissement capacités/sécurité, source de l'écart de moyens entre les deux courses.
LLMs cheat at chess
Palisade Research, 2025. Les LLMs de raisonnement chargés de gagner aux échecs piratent le moteur de jeu plutôt que de jouer ; reward hacking observé en conditions réelles.
Livres
Essentiels (alignement et risque existentiel)
If Anyone Builds It, Everyone Dies
Eliezer Yudkowsky & Nate Soares, 2025. L'argument le plus complet et récent pour le risque d'extinction. Disponible gratuitement sur le site du livre.
Superintelligence: Paths, Dangers, Strategies
Nick Bostrom, 2014. L'ouvrage fondateur sur les risques de l'IA surhumaine.
Human Compatible
Stuart Russell, 2019. Le problème de l'alignement expliqué par l'auteur du manuel de référence en IA.
The Precipice: Existential Risk and the Future of Humanity
Toby Ord, 2020. Vue d'ensemble des risques existentiels. Le chapitre sur l'IA est excellent.
AI: Unexplainable, Unpredictable, Uncontrollable
Roman Yampolskiy, 2024. Arguments formels sur l'impossibilité du contrôle.
Recommandés (contexte plus large)
Life 3.0 / La Vie 3.0
Max Tegmark, 2017. Introduction accessible aux scénarios futurs de l'IA. Existe en français.
The Alignment Problem
Brian Christian, 2020. Introduction narrative aux problèmes techniques de l'alignement.
Smarter Than Us
Stuart Armstrong, 2014. Court et accessible, bonne première lecture.
A Brief History of Intelligence
Max Bennett, 2023. Contexte sur l'intelligence biologique et artificielle.
Artificial Superintelligence: A Futuristic Approach
Roman Yampolskiy, 2015. Analyse technique des scénarios de superintelligence.
Déclarations et appel à l'action
Lignes Rouges pour l'IA (CeSIA)
Propositions de limites à ne pas franchir.
Déclaration sur la Superintelligence (FLI)
Appel international à interdire le développement de superintelligence artificielle.
Statement on AI Risk (CAIS)
« La réduction du risque d'extinction lié à l'IA devrait être une priorité mondiale au même titre que les pandémies et la guerre nucléaire. »
Faire entendre votre voix
L'IA ne détruira pas QUE votre emploi (Pause IA)
Perte de contrôle croissante sur nos vies et sur nos sociétés. Venez témoigner, participer à l'enquête et envoyer un mail à vos représentants.
Rejoindre Pause Action (Pause IA)
Chaque semaine une action en quelques clics pour faire pencher la balance (WhatsApp).
Une ressource à suggérer ?
Vous connaissez une référence francophone ou internationale qui devrait figurer ici ? Écrivez-nous avec le modèle pré-rempli ; votre client mail s'ouvrira directement avec tous les champs prêts.
Suggérer une ressource