Andrej Karpathy

Chercheur slovaquo-canadien en IA, enseignant et développeur open-source ; membre fondateur d’OpenAI, ancien directeur de l’IA chez Tesla, fondateur d’Eureka Labs et membre du staff technique chez Anthropic.


Informations générales / Profil

Champ Détails
Nom complet Andrej Karpathy
Naissance 23 octobre 1986, Bratislava, Tchécoslovaquie (aujourd’hui Slovaquie)
Nationalité Slovaquo-canadienne
Institution actuelle Anthropic
Domaines de recherche Apprentissage profond, vision par ordinateur, traitement automatique du langage naturel, pré-entraînement de grands modèles de langue
Directeur de thèse Fei-Fei Li
Thèse de doctorat Connecting Images and Natural Language (Université Stanford, 2016)
Site personnel karpathy.ai
X / Twitter @karpathy
GitHub github.com/karpathy
Google Scholar scholar.google.com/citations?user=l8WuQJgAAAAJ

Aperçu

Andrej Karpathy est un chercheur et enseignant slovaquo-canadien en IA, largement considéré comme l’une des figures les plus influentes de l’apprentissage profond moderne. Membre fondateur d’OpenAI, il a ensuite été directeur de l’IA chez Tesla, où il supervisait les systèmes de vision par ordinateur qui sous-tendent les programmes Autopilot et Full Self-Driving. Il est le créateur du cours CS 231n, le premier cours d’apprentissage profond de Stanford, qui est devenu l’un des cours les plus suivis de l’université et un programme de référence dans le monde entier. En mai 2026, il a rejoint Anthropic en tant que membre du staff technique, dédié à la recherche en pré-entraînement, avec pour mission de constituer une équipe utilisant Claude pour accélérer la science des entraînements à grande échelle. Au-delà de ses rôles de recherche, Karpathy est l’un des enseignants en IA les plus suivis sur YouTube et l’inventeur du terme vibe coding, que le dictionnaire Collins a élu mot de l’année.


Jeunesse et formation

Enfance et déménagement au Canada

Karpathy est né le 23 octobre 1986 à Bratislava, alors en Tchécoslovaquie (aujourd’hui Slovaquie). À l’âge de 15 ans, sa famille a déménagé à Toronto, au Canada, où il a terminé ses études secondaires. Avant même l’université, il s’intéressait déjà à l’informatique et aux compétitions de loisir : à partir de 2006, il animait une chaîne YouTube sous le pseudo badmephisto, publiant des tutoriels de résolution rapide du Rubik’s cube qui ont cumulé plus de 9 millions de vues et influencé des speedcubers de renom, dont le détenteur du record du monde Feliks Zemdegs.

Université de Toronto (2005-2009)

Karpathy a obtenu un baccalauréat universitaire ès sciences avec une double spécialisation en informatique et en physique, et une mineure en mathématiques, à l’Université de Toronto en 2009. Durant cette période, il a découvert l’apprentissage profond en assistant aux cours et aux groupes de lecture de Geoffrey Hinton, une expérience qu’il considère comme fondatrice de sa trajectoire de recherche.

Université de la Colombie-Britannique (2009-2011)

Il a poursuivi une maîtrise ès sciences à l’Université de la Colombie-Britannique sous la supervision de Michiel van de Panne, en se concentrant sur l’apprentissage de contrôleurs pour des figures physiquement simulées — en appliquant l’apprentissage automatique à l’animation de personnages agiles et à la robotique en simulation. Ce travail a donné lieu à un article cosigné au SIGGRAPH 2011 sur les compétences de locomotion pour des quadrupèdes simulés.

Doctorat à l’Université Stanford (2011-2015)

Karpathy a rejoint le Vision Lab de Stanford pour y préparer un doctorat sous la direction de Fei-Fei Li, obtenant son diplôme en 2015 (la thèse ayant été formellement soumise en 2016). Sa thèse, Connecting Images and Natural Language, explorait l’intersection des réseaux neuronaux convolutionnels et récurrents pour des tâches telles que la légende d’images et l’alignement visuo-sémantique. Pendant son doctorat, il a effectué trois stages de recherche : Google Brain (2011, apprentissage non supervisé à partir de vidéos), Google Research (2013, apprentissage supervisé à grande échelle sur YouTube) et DeepMind (2015, apprentissage par renforcement profond avec Koray Kavukcuoglu et Vlad Mnih). Il a également conçu et enseigné le cours CS 231n : Convolutional Neural Networks for Visual Recognition, le premier cours d’apprentissage profond de Stanford, qui comptait 150 étudiants en 2015 et 750 en 2017.


Carrière

OpenAI — Chercheur fondateur (2015-2017)

Karpathy faisait partie des premiers chercheurs nommés lors de la présentation publique d’OpenAI en décembre 2015, rejoignant l’équipe fondatrice de l’organisation à but non lucratif. Durant cette période, ses travaux portaient principalement sur l’apprentissage profond et la vision par ordinateur. Il a quitté l’organisation à la mi-2017 lorsque Tesla l’a recruté directement.

Tesla — Directeur de l’IA (2017-2022)

En juin 2017, Karpathy est devenu directeur de l’intelligence artificielle et de la vision Autopilot chez Tesla, relevant d’Elon Musk. À ce poste, il dirigeait l’ensemble de la pile de vision par ordinateur pour Tesla Autopilot et Full Self-Driving (FSD) : pipelines internes d’étiquetage de données, entraînement de réseaux neuronaux et déploiement sur la puce d’inférence personnalisée de Tesla. Il a présenté l’architecture de son équipe publiquement lors du Tesla Autonomy Day 2019 et du Tesla AI Day 2021. Il a également supervisé brièvement les travaux préliminaires sur le robot humanoïde Tesla Optimus avant son départ. Après un congé sabbatique de plusieurs mois, il a annoncé sa démission en juillet 2022.

Indépendant — YouTube et open-source (2022-2023)

Entre son départ de Tesla et son retour chez OpenAI, Karpathy a publié une série de projets open-source et de conférences éducatives sur YouTube extrêmement influentes. Cette période a vu naître nanoGPT (plus de 54 000 étoiles GitHub), un cadre minimal d’entraînement de GPT ; llm.c (plus de 29 000 étoiles), une implémentation pure en C/CUDA de l’entraînement de grands modèles de langue ; et la série vidéo « Neural Networks : Zero to Hero », un programme pas à pas pour construire des réseaux neuronaux à partir des premiers principes. Ces ressources ont été largement adoptées dans les cours universitaires et les programmes d’auto-apprentissage du monde entier.

OpenAI — Retour (2023-2024)

Le 9 février 2023, Karpathy a annoncé son retour chez OpenAI, où il a rejoint une équipe travaillant sur l’entraînement intermédiaire et la génération de données synthétiques. Il est reparti le 13 février 2024, son départ ayant été confirmé par un porte-parole d’OpenAI. Durant ce second mandat, il a donné la conférence largement partagée State of GPT lors du Microsoft Build 2023.

Eureka Labs — Fondateur (2024-2026)

Le 16 juillet 2024, Karpathy a annoncé la création d’Eureka Labs, une entreprise d’éducation native de l’IA. Le concept central était d’associer des enseignants humains à des assistants pédagogiques capables de personnaliser l’enseignement à grande échelle. Le produit phare de l’entreprise était LLM101n : Let’s Build A Storyteller, un cours guidant les étudiants dans la construction d’un grand modèle de langue de bout en bout. En février 2025, il a inventé le terme vibe coding pour décrire un flux de travail de programmation dans lequel le développeur délègue entièrement la génération de code à un modèle d’IA via des invites en langage naturel ; le dictionnaire Collins l’a élu mot de l’année 2025.

Anthropic — Membre du staff technique (2026-présent)

Le 19 mai 2026, Karpathy a annoncé avoir rejoint Anthropic en tant que membre du staff technique. Il travaille au sein de l’équipe de pré-entraînement dirigée par Nick Joseph, avec pour mission de créer un nouveau groupe de recherche axé sur l’utilisation de Claude pour accélérer la science du pré-entraînement lui-même — une forme de recherche assistée par l’IA visant à rendre l’entraînement futur des modèles plus efficace et plus automatisé.


Principales contributions

  • CS 231n : Convolutional Neural Networks for Visual Recognition — A conçu et enseigné le premier cours dédié à l’apprentissage profond à Stanford en 2015 ; il est devenu l’un des plus grands cours de l’université (150 à 750 étudiants en trois ans), et ses vidéos de cours et notes librement accessibles restent un point d’entrée majeur pour les praticiens du monde entier.

  • “Deep Visual-Semantic Alignments for Generating Image Descriptions” (CVPR 2015, Oral) — Un jalon précoce dans la modélisation vision-langage, alignant conjointement des régions d’images et des fragments de phrases à l’aide d’un réseau neuronal récurrent multimodal.

  • “The Unreasonable Effectiveness of Recurrent Neural Networks” (article de blog, 2015) — Une démonstration très lue de modèles de langage au niveau du caractère, devenue l’une des introductions canoniques à la modélisation de séquences pour une génération de praticiens.

  • char-rnn — Un modèle de langage au niveau du caractère précoce et open-source en Lua/Torch qui a popularisé l’expérimentation pratique avec les modèles de séquences avant l’ère du transformeur.

  • Pile de vision Tesla Autopilot — A dirigé la refonte de bout en bout du système de perception de Tesla Autopilot, passant d’une fusion radar-carte à une approche purement visuelle et centrée sur les données, déployée à grande échelle sur du silicium personnalisé.

  • “Software 2.0” (Medium, 2017) — Un essai présentant les réseaux neuronaux comme un nouveau paradigme de programmation dans lequel les poids du modèle remplacent le code écrit à la main, largement cité dans les discussions sur le changement structurel de l’industrie.

  • nanoGPT — Un référentiel d’entraînement de GPT minimal et facilement modifiable (plus de 54 000 étoiles GitHub) qui a rendu la reproduction de modèles de classe GPT accessible aux chercheurs et aux étudiants sans budgets de calcul importants.

  • llm.c — Une implémentation from scratch de l’entraînement de grands modèles de langue en C/CUDA (plus de 29 000 étoiles), démontrant l’algorithme complet sans abstractions de framework.

  • micrograd — Un moteur de gradation automatique scalaire de 100 lignes avec une API de type PyTorch (plus de 15 000 étoiles), largement utilisé comme outil pédagogique pour la rétropropagation.

  • Série YouTube « Zero to Hero » — Un programme vidéo gratuit et techniquement rigoureux pour construire des réseaux neuronaux et des modèles de langue à partir des premiers principes ; parmi les contenus éducatifs techniques en IA les plus visionnés en ligne.

  • « Deep Dive into LLMs like ChatGPT » (YouTube, 2024) — Une conférence pour le grand public sur le fonctionnement interne des grands modèles de langue, qui a atteint un large public au-delà de la communauté du machine learning.

  • Vibe coding — Inventé en février 2025 pour décrire la programmation déléguée à l’IA via des invites en langage naturel ; le terme a été adopté par l’industrie et élu mot de l’année 2025 par le dictionnaire Collins.

  • arxiv-sanity — Une application web pour filtrer et découvrir les prépublications arXiv par pertinence et similarité, utilisée par de nombreux chercheurs pour gérer le volume de publications en apprentissage automatique.


Prix et distinctions

  • MIT Technology Review Innovators Under 35 (2020) — Reconnu pour son travail à la tête de l’équipe IA et vision Autopilot de Tesla.

  • TIME100 Most Influential People in AI (2024) — Figure sur la première liste des 100 personnalités les plus influentes de l’intelligence artificielle du magazine Time.

  • Mot de l’année du dictionnaire Collins — « vibe coding » (2025) — Un terme inventé par Karpathy en février 2025 ; Collins l’a sélectionné comme le nouveau mot emblématique de l’année.


Relations clés

  • Fei-Fei Li — Directrice de thèse au Vision Lab de Stanford ; coautrice de plusieurs articles fondateurs en vision-langage, dont le travail de légende d’images du CVPR 2015.

  • Geoffrey Hinton — Influence durant la licence ; Karpathy attribue sa participation aux groupes de lecture de Hinton à l’Université de Toronto comme l’origine de son intérêt pour l’apprentissage profond.

  • Michiel van de Panne — Directeur de maîtrise à l’UBC ; a introduit Karpathy à la simulation physique et à l’apprentissage par renforcement pour le contrôle moteur.

  • Elon Musk — Relation hiérarchique directe pendant cinq ans en tant que directeur de l’IA chez Tesla ; Musk a publiquement reconnu le départ de Karpathy en 2022.

  • Sam Altman / direction d’OpenAI — A travaillé sous leur direction lors des deux périodes d’emploi chez OpenAI (2015-2017, 2023-2024) ; Karpathy faisait partie de la cohorte fondatrice originale.

  • Justin Johnson — Collègue de doctorat à Stanford et collaborateur fréquent ; coauteur de DenseCap et de l’article Visualizing and Understanding Recurrent Networks ; a coanimé un groupe de lecture en apprentissage profond sur Clubhouse.

  • Andrew Ng — Collègue de Stanford dont la présence, aux côtés de Daphne Koller, Sebastian Thrun et Vladlen Koltun, a marqué l’environnement doctoral de Karpathy ; a ensuite cité Karpathy dans des discussions sur l’éducation en IA.

  • Nick Joseph — Responsable d’équipe actuel chez Anthropic, supervisant le département de pré-entraînement sous lequel Karpathy travaille désormais.


Style personnel

Karpathy allie une forte préférence pour le minimalisme et la lisibilité à un instinct pédagogique : ses projets open-source les plus influents dépouillent délibérément les abstractions des frameworks pour exposer l’algorithme sous-jacent, une philosophie qu’il explicite dans des dépôts comme micrograd et llm.c. Ses écrits publics et ses conférences privilégient les exemples concrets et exécutables plutôt que l’exposé théorique, et il s’attache constamment à rendre les concepts de pointe accessibles aux praticiens sans matériel spécialisé. Sur les réseaux sociaux, ses messages alternent entre observations techniques, inventions conceptuelles (vibe coding, tokenmaxxing) et réflexions franches sur le rythme et la direction du domaine, lui donnant une voix qui s’adresse à la fois aux spécialistes et au grand public. Il est connu pour sa franchise intellectuelle et un certain irrévérence — son site personnel, écrit en pur HTML et CSS sans frameworks, est en soi une déclaration sur le minimalisme technologique.


Références