Slowakisch-kanadischer KI-Forscher, Pädagoge und Open-Source-Entwickler; Gründungsmitglied von OpenAI, ehemaliger KI-Direktor bei Tesla, Gründer von Eureka Labs und technischer Mitarbeiter bei Anthropic.
Grundlegende Informationen / Profil
| Feld | Details |
|---|---|
| Vollständiger Name | Andrej Karpathy |
| Geboren | 23. Oktober 1986, Bratislava, Tschechoslowakei (heute Slowakei) |
| Staatsangehörigkeit | Slowakisch-kanadisch |
| Aktuelle Institution | Anthropic |
| Forschungsfelder | Deep Learning, Computer Vision, natürliche Sprachverarbeitung, Pre-Training großer Sprachmodelle |
| PhD-Betreuerin | Fei-Fei Li |
| PhD-Dissertation | Connecting Images and Natural Language (Stanford University, 2016) |
| Persönliche Website | karpathy.ai |
| X / Twitter | @karpathy |
| GitHub | github.com/karpathy |
| Google Scholar | scholar.google.com/citations?user=l8WuQJgAAAAJ |
Überblick
Andrej Karpathy ist ein slowakisch-kanadischer KI-Forscher und Pädagoge, der weithin als eine der einflussreichsten Persönlichkeiten des modernen Deep Learning gilt. Als Gründungsmitglied von OpenAI war er später Direktor für KI bei Tesla, wo er die Computer-Vision-Systeme beaufsichtigte, die den Autopilot- und Full-Self-Driving-Programmen zugrunde liegen. Er ist der Architekt von CS 231n, dem ersten Deep-Learning-Kurs an der Stanford University, der zu einer der am stärksten besuchten Vorlesungen der Universität wurde und weltweit als Referenzcurriculum dient. Im Mai 2026 wechselte er zu Anthropic als technischer Mitarbeiter mit Schwerpunkt auf Pre-Training-Forschung, mit der Aufgabe, ein Team aufzubauen, das Claude nutzt, um die Wissenschaft großer Trainingsläufe zu beschleunigen. Über seine Forschungsrollen hinaus ist Karpathy einer der meistverfolgten KI-Pädagogen auf YouTube und der Urheber des Begriffs Vibe Coding, den das Collins Dictionary zum Wort des Jahres kürte.
Frühes Leben & Ausbildung
Kindheit und Umzug nach Kanada
Karpathy wurde am 23. Oktober 1986 in Bratislava geboren, das damals Teil der Tschechoslowakei (heute Slowakei) war. Im Alter von 15 Jahren zog seine Familie nach Toronto, Kanada, wo er die weiterführende Schule abschloss. Bereits vor dem Studium entwickelte er ein Interesse an Informatik und wettbewerbsorientierten Hobbys: Ab 2006 betrieb er einen YouTube-Kanal unter dem Namen badmephisto, auf dem er Tutorials zum Lösen des Zauberwürfels veröffentlichte, die über 9 Millionen Aufrufe erzielten und prominente Speedcuber wie den Weltrekordhalter Feliks Zemdegs beeinflussten.
University of Toronto (2005–2009)
Karpathy schloss 2009 an der University of Toronto einen Bachelor of Science mit einem Doppelhauptfach in Informatik und Physik und einem Nebenfach in Mathematik ab. In dieser Zeit lernte er Deep Learning erstmals kennen, indem er Geoffrey Hintons Vorlesungen und Lesegruppen besuchte – eine Erfahrung, die er als grundlegend für seinen wissenschaftlichen Werdegang bezeichnet.
University of British Columbia (2009–2011)
Er absolvierte einen Master of Science an der University of British Columbia unter der Betreuung von Michiel van de Panne, wobei er sich auf Lerncontroller für physikalisch simulierte Figuren konzentrierte – im Wesentlichen die Anwendung von maschinellem Lernen auf agile Charakteranimation und Robotik in der Simulation. Diese Arbeit umfasste ein 2011 auf der SIGGRAPH veröffentlichtes Co-Autorenpapier über Fortbewegungsfähigkeiten für simulierte Vierbeiner.
PhD an der Stanford University (2011–2015)
Karpathy trat dem Vision Lab der Stanford University bei, um unter Fei-Fei Li zu promovieren. Er schloss sein Studium 2015 ab (die Dissertation wurde 2016 offiziell eingereicht). Seine Dissertation Connecting Images and Natural Language erforschte die Schnittstelle zwischen Convolutional Neural Networks und Recurrent Neural Networks für Aufgaben wie Bildbeschriftung und visuell-semantische Ausrichtung. Während der Promotion absolvierte er drei Forschungspraktika: Google Brain (2011, unüberwachtes Lernen aus Videos), Google Research (2013, groß angelegtes überwachtes Lernen auf YouTube) und DeepMind (2015, Deep Reinforcement Learning mit Koray Kavukcuoglu und Vlad Mnih). Er entwarf und unterrichtete auch den CS 231n: Convolutional Neural Networks for Visual Recognition, den ersten Deep-Learning-Kurs an der Stanford University, der 2015 150 Studierende einschrieb und bis 2017 auf 750 anwuchs.
Karriere
OpenAI – Gründungsforscher (2015–2017)
Karpathy gehörte zu den ersten Forschungswissenschaftlern, die genannt wurden, als OpenAI im Dezember 2015 der Öffentlichkeit vorgestellt wurde. Er trat dem Gründungsteam der Non-Profit-Organisation bei. In dieser Zeit konzentrierte sich seine Arbeit auf Deep Learning und Computer Vision. Er verließ das Unternehmen Mitte 2017, als Tesla ihn direkt abwarb.
Tesla – Direktor für KI (2017–2022)
Im Juni 2017 wurde Karpathy Teslas Direktor für Künstliche Intelligenz und Autopilot-Vision, berichtete an Elon Musk. In dieser Rolle leitete er den gesamten Computer-Vision-Stack für Tesla Autopilot und Full Self-Driving (FSD): interne Datenkennzeichnungspipelines, neuronale Netztrainings und die Bereitstellung auf Teslas eigenem Inferenzchip. Er präsentierte die Architektur seines Teams öffentlich auf dem Tesla Autonomy Day 2019 und dem Tesla AI Day 2021. Kurzzeitig beaufsichtigte er auch die ersten Arbeiten am humanoiden Roboter Tesla Optimus, bevor er das Unternehmen verließ. Nach einer mehrmonatigen Auszeit gab er im Juli 2022 seinen Rücktritt bekannt.
Unabhängig – YouTube & Open Source (2022–2023)
In der Zeit zwischen dem Ausscheiden bei Tesla und der Rückkehr zu OpenAI veröffentlichte Karpathy eine Reihe äußerst einflussreicher Open-Source-Projekte und lehrreicher YouTube-Vorträge. In dieser Zeit entstanden nanoGPT (über 54.000 GitHub-Sterne), ein minimales GPT-Trainingsframework; llm.c (über 29.000 Sterne), eine reine C/CUDA-Implementierung des LLM-Trainings; und die Videoserie „Neural Networks: Zero to Hero“, ein Schritt-für-Schritt-Lehrplan, der neuronale Netze von Grund auf aufbaut. Diese Materialien wurden weltweit in Universitätskursen und Selbststudienprogrammen weitgehend übernommen.
OpenAI – Rückkehr (2023–2024)
Am 9. Februar 2023 gab Karpathy seine Rückkehr zu OpenAI bekannt, wo er sich einem Team anschloss, das sich auf Mid-Training und synthetische Datengenerierung konzentrierte. Am 13. Februar 2024 verließ er das Unternehmen erneut, der Wechsel wurde von einem OpenAI-Sprecher bestätigt. Während dieser zweiten Amtszeit hielt er den viel beachteten Vortrag State of GPT auf der Microsoft Build 2023.
Eureka Labs – Gründer (2024–2026)
Am 16. Juli 2024 gründete Karpathy Eureka Labs, ein KI-natives Bildungsunternehmen. Das Kernkonzept bestand darin, menschliche Lehrkräfte mit KI-Tutoren zu paaren, die den Unterricht in großem Maßstab personalisieren können. Das Flaggschiffprodukt des Unternehmens war LLM101n: Let’s Build A Storyteller, ein Kurs, der die Studierenden durch den Aufbau eines großen Sprachmodells von Anfang bis Ende führt. Im Februar 2025 prägte er den Begriff Vibe Coding, um einen Programmierworkflow zu beschreiben, bei dem der Entwickler die Codegenerierung vollständig an ein KI-Modell delegiert, indem er natürliche Sprachaufforderungen verwendet; das Collins Dictionary wählte es zum Wort des Jahres 2025.
Anthropic – Technischer Mitarbeiter (2026–heute)
Am 19. Mai 2026 gab Karpathy bekannt, dass er zu Anthropic als technischer Mitarbeiter gestoßen sei. Er arbeitet im Pre-Training-Team unter der Teamleiterin Nick Joseph mit dem Auftrag, eine neue Forschungsgruppe aufzubauen, die sich darauf konzentriert, Claude zu nutzen, um die Wissenschaft des Pre-Trainings selbst zu beschleunigen – eine Form der KI-gestützten Forschung, die darauf abzielt, zukünftiges Modelltraining effizienter und automatisierter zu gestalten.
Hauptbeiträge
-
CS 231n: Convolutional Neural Networks for Visual Recognition – Konzipiert und unterrichtet als erster dedizierter Deep-Learning-Kurs der Stanford University im Jahr 2015; er wurde zu einem der größten Kurse der Universität (150 –> 750 Studierende in drei Jahren), und seine frei verfügbaren Vorlesungsvideos und -notizen sind nach wie vor ein primärer Einstiegspunkt für Praktiker weltweit.
-
Deep Visual-Semantic Alignments for Generating Image Descriptions (CVPR 2015, Vortrag) – Ein früher Meilenstein in der Vision-Sprach-Modellierung, der Bildregionen mit Satzfragmenten mittels eines multimodalen rekurrenten neuronalen Netzes ausrichtet.
-
The Unreasonable Effectiveness of Recurrent Neural Networks (Blogbeitrag, 2015) – Eine viel gelesene Demonstration zeichenbasierter Sprachmodelle, die für eine ganze Generation von Praktikern zu einer der kanonischen Einführungen in die Sequenzmodellierung wurde.
-
char-rnn – Ein frühes Open-Source-Sprachmodell auf Zeichenebene in Lua/Torch, das vor der Transformer-Ära das praktische Experimentieren mit Sequenzmodellen populär machte.
-
Tesla Autopilot Vision Stack – Leitete die durchgängige Neugestaltung des Wahrnehmungssystems von Teslas Autopilot, weg von der Radar-Karten-Fusion hin zu einem rein visionsbasierten, datenzentrierten Ansatz, der in großem Maßstab auf kundenspezifischen Siliziumchips eingesetzt wurde.
-
Software 2.0 (Medium, 2017) – Ein Essay, das neuronale Netze als neues Programmierparadigma darstellt, bei dem Modellgewichte handgeschriebenen Code ersetzen, und das in Diskussionen über den strukturellen Wandel der Branche weithin zitiert wird.
-
nanoGPT – Ein minimales, hackbares GPT-Trainingsrepository (über 54.000 GitHub-Sterne), das die Reproduktion von GPT-Klassenmodellen für Forscher und Studierende ohne große Rechenbudgets zugänglich machte.
-
llm.c – Eine From-Scratch-Implementierung des LLM-Trainings in C/CUDA (über 29.000 Sterne), die den gesamten Algorithmus ohne Framework-Abstraktionen demonstriert.
-
micrograd – Eine 100-zeilige, skalarwertige Autograd-Engine mit einer PyTorch-ähnlichen API (über 15.000 Sterne), die häufig als Lehrmittel für Backpropagation verwendet wird.
-
YouTube-Serie „Zero to Hero“ – Ein kostenloser, technisch rigoroser Videolehrplan, der neuronale Netze und Sprachmodelle von Grund auf aufbaut; gehört zu den meistgesehenen technischen KI-Bildungsinhalten im Internet.
-
Deep Dive into LLMs like ChatGPT (YouTube, 2024) – Ein allgemeinverständlicher Vortrag über die inneren Abläufe großer Sprachmodelle, der eine breite Zuschauerschaft jenseits der ML-Community erreichte.
-
Vibe Coding – Geprägt im Februar 2025, um KI-delegiertes Programmieren mittels natürlicher Sprachaufforderungen zu beschreiben; der Begriff wurde branchenweit übernommen und vom Collins Dictionary zum Wort des Jahres 2025 gewählt.
-
arxiv-sanity – Eine Webanwendung zum Filtern und Entdecken von arXiv-Preprints nach Relevanz und Ähnlichkeit, die von vielen Forschern genutzt wird, um die Flut an ML-Publikationen zu bewältigen.
Auszeichnungen & Anerkennungen
-
MIT Technology Review Innovators Under 35 (2020) – Anerkannt für seine Arbeit als Leiter des KI- und Autopilot-Vision-Teams bei Tesla.
-
TIME100 Most Influential People in AI (2024) – Aufgenommen in Time Magazines erste Liste der 100 einflussreichsten Persönlichkeiten der künstlichen Intelligenz.
-
Collins Dictionary Wort des Jahres – „vibe coding“ (2025) – Ein Begriff, den Karpathy im Februar 2025 prägte; Collins wählte ihn als das prägende neue Wort des Jahres.
Wichtige Beziehungen
-
Fei-Fei Li – PhD-Betreuerin am Stanford Vision Lab; Co-Autorin bei mehreren grundlegenden Vision-Language-Papieren, einschließlich der CVPR-2015-Arbeit zur Bildbeschriftung.
-
Geoffrey Hinton – Einfluss im Grundstudium; Karpathy führt den Besuch von Hinton Lesegruppen an der University of Toronto als Ursprung seines Interesses an Deep Learning an.
-
Michiel van de Panne – Master-Betreuer an der UBC; führte Karpathy in physikbasierte Simulation und Reinforcement Learning für die Bewegungssteuerung ein.
-
Elon Musk – Direkte Berichtsbeziehung während seiner fünfjährigen Tätigkeit als Teslas KI-Direktor; Musk bestätigte öffentlich Karpathys Ausscheiden im Jahr 2022.
-
Sam Altman / OpenAI-Führung – Arbeitete unter ihnen in beiden Beschäftigungsphasen bei OpenAI (2015–2017, 2023–2024); Karpathy gehörte zum ursprünglichen Gründungskreis.
-
Justin Johnson – Stanford-PhD-Kollege und häufiger Mitarbeiter; Co-Autor von DenseCap und des Papiers „Visualizing and Understanding Recurrent Networks“; moderierte gemeinsam eine Deep-Learning-Lesegruppe auf Clubhouse.
-
Andrew Ng – Stanford-Kollege, dessen Präsenz zusammen mit Daphne Koller, Sebastian Thrun und Vladlen Koltun Karpathys PhD-Umfeld prägte; zitierte Karpathy später in Diskussionen über KI-Bildung.
-
Nick Joseph – Derzeitiger Teamleiter bei Anthropic, der die Pre-Training-Abteilung beaufsichtigt, unter der Karpathy nun arbeitet.
Persönlicher Stil
Karpathy verbindet eine starke Vorliebe für Minimalismus und Lesbarkeit mit pädagogischem Instinkt: Seine einflussreichsten Open-Source-Projekte streifen bewusst Framework-Abstraktionen ab, um den zugrunde liegenden Algorithmus freizulegen – eine Philosophie, die er in Repositories wie micrograd und llm.c explizit formuliert. Seine öffentlichen Schriften und Vorträge bevorzugen konkrete, ausführbare Beispiele gegenüber theoretischer Darlegung, und er priorisiert stets die Zugänglichkeit von Spitzenkonzepten für Praktiker ohne spezielle Hardware. In den sozialen Medien schwanken seine Beiträge zwischen technischen Beobachtungen, konzeptionellen Wortprägungen (Vibe Coding, Tokenmaxxing) und offenen Reflexionen über das Tempo und die Richtung des Fachgebiets, was ihm eine Stimme verleiht, die sowohl Fach- als auch Laienpublikum anspricht. Er ist bekannt für intellektuelle Direktheit und ein gewisses Maß an Respektlosigkeit – seine persönliche Website, die in purem HTML und CSS ohne Frameworks geschrieben ist, ist selbst eine Aussage über technologischen Minimalismus.
Referenzen
-
karpathy.ai – Persönliche Website
-
TechCrunch, „OpenAI co-founder Andrej Karpathy joins Anthropic’s pre-training team,“ 19. Mai 2026
-
Axios, „Andrej Karpathy joins Anthropic,“ 19. Mai 2026
-
MIT Technology Review, „Innovators Under 35: Andrej Karpathy,“ 2020
-
Time, „The 100 Most Influential People in AI 2024: Andrej Karpathy,“ September 2024