Soumith Chintala

ref · 25. Mai 2026 um 07:53

Mitbegründer und langjähriger Leiter von PyTorch, dem Open-Source-Framework, das über 90 % der weltweiten KI-Forschung antreibt – ein in Hyderabad geborener Ingenieur, der von zwölf US-Universitäten für ein Graduiertenstudium abgelehnt wurde und dann die Softwareebene baute, auf der der Großteil der modernen KI läuft.

Profil

Bereich	Details
Staatsangehörigkeit	indisch-amerikanisch
Geboren	Hyderabad, Indien
Aktuelle Rolle	CTO, Thinking Machines Lab; angeschlossener Forscher, NYU
Forschungsbereiche	KI-Infrastruktur, Deep-Learning-Frameworks, Open-Source-Ökosysteme, Generative Modelle, Heimrobotik
Ausbildung	B.Tech, Informationstechnologie, VIT Vellore (2009); M.S., Informatik, NYU (~2012)
Persönliche Website	soumith.ch
Blog	soumith.ch/blog
X / Twitter	@soumithchintala
GitHub	@soumith
Google Scholar	scholar.google.com

Überblick

Soumith Chintala ist ein indisch-amerikanischer KI-Ingenieur, Forscher und Community-Builder, der vor allem als Mitbegründer und langjähriger Leiter von PyTorch bekannt ist – dem Open-Source-Deep-Learning-Framework, das er ab 2016 bei Meta’s FAIR aufbaute und das heute über 90 % der weltweiten KI-Forschung und Produktionssysteme antreibt. Er verbrachte elf Jahre bei Meta, das er im November 2025 nach seinem Ausscheiden aus dem, was er als „einen der einflussreichsten Posten der KI-Branche“ bezeichnete, verließ. Anschließend wechselte er zu Thinking Machines Lab, Mira Muratis KI-Startup, wo er im Januar 2026 zum CTO ernannt wurde. Zu seinen Forschungsbeiträgen gehören grundlegende GAN-Arbeiten (LAPGAN, DCGAN, Wasserstein GAN), Community-Infrastrukturarbeit (Torch-7, EBLearn, convnet-benchmarks) und laufende Heimrobotik-Forschung an der NYU. Seine Geschichte wird oft als Illustration von Beharrlichkeit angeführt: Er bewarb sich für seinen Masterabschluss an zwölf US-Universitäten und wurde von allen abgelehnt, bevor er schließlich an der NYU aufgenommen wurde, wo er bei Yann LeCun studierte.

Frühes Leben und Ausbildung

Chintala wuchs in Hyderabad, Indien, auf und besuchte die Hyderabad Public School. Nach eigenen Angaben hatte er in seinen frühen Jahren Schwierigkeiten mit Mathematik und kam eher durch selbstgesteuerte Neugier als durch schulische Exzellenz zu Computern und Problemlösung. Er hat seinen Weg als geprägt von einer tiefen Anziehungskraft zu Open-Source-Software beschrieben – eine Ausrichtung, die er zum Teil darauf zurückführt, dass er ohne Zugang zu Antworten aufwuchs und feststellte, dass offenes Wissen „die Spielregeln angleicht“.

B.Tech, Informationstechnologie – Vellore Institute of Technology (VIT), Tamil Nadu, Indien, 2005–2009
Chintala absolvierte sein Grundstudium am VIT Vellore, einem nach den Maßstäben der wettbewerbsorientierten indischen Tech-Rekrutierung mittelmäßigen indischen Ingenieur-College. Nach seinem Abschluss bewarb er sich für einen Master in Informatik an zwölf US-Universitäten – und wurde von allen abgelehnt. Anstatt nach Indien zurückzukehren oder den Plan aufzugeben, zog er mit einem J-1-Visum in die Vereinigten Staaten, ohne einen klaren Weg vor sich zu haben, und sicherte sich schließlich einen Studienplatz an der NYU.

M.S., Informatik – New York University (~2010–2012)
An der NYU wurde Chintala von Yann LeCun betreut, der damals das Courant Institute der NYU als Zentrum der Deep-Learning-Forschung etablierte. Seine Graduiertenarbeit umfasste Robotik, Computer Vision und frühe generative Modellierung und beinhaltete Beiträge zu EBLearn – einem C+±Deep-Learning-Framework, das er zusammen mit LeCun und Pierre Sermanet pflegte. Diese Zeit war prägend: Die direkte Zusammenarbeit mit LeCun in den frühen Jahren der Deep-Learning-Wiederbelebung und die Mitarbeit an Open-Source-ML-Tools begründeten sowohl die technische Tiefe als auch die Community-Orientierung, die seine spätere Karriere prägen sollten.

Karriere

EBLearn und frühe Open-Source-Arbeit (vor 2012)

Vor und während seines NYU-Masters war Chintala Co-Maintainer von EBLearn, einem C+±Framework für Deep Learning, das in LeCuns Labor entwickelt wurde. Auf seinem Höhepunkt war EBLearn eines der primären Werkzeuge für die Deep-Learning-Forschung, und Chintalas Arbeit daran – zusammen mit der Robotik- und Computer-Vision-Forschung, die er an der NYU betrieb – stellte seinen Einstieg in das Open-Source-ML-Ökosystem dar.

Meta / Facebook AI Research (FAIR) (2014–2025)

Chintala trat Facebook AI Research im Jahr 2014 bei, als FAIR ein kleines Team von etwa einem Dutzend Forschern war. Er hat die frühen FAIR-Jahre – insbesondere 2015 und 2016 – als „wahrscheinlich die produktivsten und beruflich angenehmsten Jahre meines Lebens“ beschrieben, eine Zeit der Arbeit an GANs, Objekterkennung, Starcraft-Bots und Kerninfrastruktur zusammen mit Rob Fergus, Leon Bottou, Yann LeCun, Alec Radford und anderen. Er stieg später zum Vice President auf, bevor er im November 2025 ging.

Torch-7 und convnet-benchmarks (2014–2016)
Vor PyTorch war das dominierende Open-Source-Deep-Learning-Framework, das von Facebook, Google DeepMind und Twitter verwendet wurde, Torch-7 – ein Lua-basiertes Framework, das Chintala betreute. Er erstellte auch convnet-benchmarks, eine Benchmarking-Suite für neuronale Netze, die von 2015 bis 2017 zum Goldstandard wurde, der von NVIDIA, AMD und Intel Nervana verwendet wurde, um ihre Deep-Learning-Hardware zu optimieren. Diese weniger gefeierten Beiträge etablierten die Praxis der rigorosen, vergleichenden, offenen Bewertung von ML-Systemen, die später die Designphilosophie von PyTorch prägte.

LAPGAN und DCGAN (2015)
In Zusammenarbeit mit Remi Denton, Arthur Szlam, Rob Fergus und anderen war Chintala Co-Autor von LAPGAN (NIPS 2015) – einem der ersten Papers, das mit einem GAN-basierten Ansatz plausible fotografische Bilder erzeugte, unter Verwendung einer Laplace-Pyramiden-Architektur. Das begleitende DCGAN-Paper (arXiv 2015, mit Radford und Metz) führte die tiefe konvolutionelle GAN-Architektur mit Trainingstechniken zur Stabilisierung ein, die GANs für die Bilderzeugung praktisch nutzbar machten. DCGAN wurde zu einem der am häufigsten zitierten GAN-Papers und leitete effektiv die Ära der generativen Bildmodellierung ein, die zu Stable Diffusion, DALL-E und nachfolgenden Bildgenerierungssystemen führte.

Wasserstein GAN (2017)
In Co-Autorenschaft mit Martin Arjovsky und Leon Bottou führte Wasserstein GAN die Wasserstein-Distanz als Trainingsziel für GANs ein, was die Trainingsstabilität und theoretische Fundierung erheblich verbesserte. Chintala beschrieb später, dass er GANs aufgegeben habe, „nachdem es nicht gelang, sie zu stabilen Trainingsalgorithmen zu machen“ – eine ehrliche Einschätzung, die auch sein Ingenieursethos widerspiegelt: Wenn eine Technik nicht zuverlässig eingesetzt werden kann, verdient sie noch nicht sein volles Engagement.

PyTorch – Mitbegründung und Leitung (2016–2025)
PyTorch wurde 2016 bei FAIR entwickelt und Anfang 2017 der Öffentlichkeit zugänglich gemacht. Zu den Gründungsbeiträgen gehörten Chintala, Adam Paszke, Sam Gross, Greg Chanan, Alban Desmaison, Edward Yang und andere. Die zentrale Designphilosophie – dynamische Berechnungsgraphen (define-by-run) anstelle der statischen Graphen von TensorFlow – machte PyTorch dramatisch einfacher zu debuggen und zu iterieren, und die Python-zentrierte API senkte die Eintrittsbarriere für Forscher ohne Systemprogrammierkenntnisse.

Chintala fungierte fast acht Jahre lang als de facto Leiter von PyTorch und agierte gleichzeitig als Produktmanager, technischer Leiter, Kommunikationsdirektor, Community-Manager und Release-Ingenieur. Er beantwortete Tausende von Fragen im PyTorch-Forum und in den Torch-Foren; er hat dieses basisdemokratische Community-Engagement als zentral dafür beschrieben, wie gute Produkte entstehen. Unter seiner Führung wuchs PyTorch von einem Forschungsprototypen zu dem Framework, das im Wesentlichen jedes führende KI-Unternehmen antreibt – einschließlich des Trainings von GPT, Claude, Gemini, LLaMA und Stable Diffusion – sowie Produktionseinsätze bei Tesla, Instagram, TikTok, Snapchat, Pinterest und großen pharmazeutischen Forschungsprogrammen.

Sein Abschiedsblogbeitrag (6. November 2025) beschrieb PyTorch als „Exascale-Training“ bewältigend und „Foundation Models, die Intelligenz neu definieren“, und bestätigte, dass das Framework eine „90%+ Adoption in der KI“ erreicht habe. Er ging mit dem expliziten Ziel, „wieder etwas Kleines zu tun“ – dem Einfluss seiner Rolle zu entkommen, um das Gefühl des Aufbaus von Grund auf zurückzugewinnen.

NYU – Angeschlossene Robotikforschung (2019–heute)

Neben seiner Meta-Rolle arbeitet Chintala mit Lerrel Pinto an der NYU an Heimrobotik-Projekten zusammen, die darauf abzielen, Roboter zu bauen, die Haushaltsaufgaben ohne erschöpfendes aufgabenspezifisches Training ausführen können:

Robot Utility Models – demonstrierten ~90 % Zero-Shot-Genauigkeit bei grundlegenden Aufgaben (Tür öffnen, Schublade öffnen, Objekt neu ausrichten) in unbekannten neuen Umgebungen.
On Bringing Robots Home (DobbE) – 109 Aufgaben, getestet in 10 New Yorker Haushalten, 81 % Erfolgsquote, wobei 20 Minuten zum Erlernen einer neuen Aufgabe benötigt wurden.
Zusätzliche Arbeit an taktilen Darstellungen, geschickter Manipulation und semantischen Gedächtnissystemen für Heimroboter.

Thinking Machines Lab – CTO (November 2025–heute)

Nach seinem Ausscheiden bei Meta im November 2025 wechselte Chintala zu Mira Muratis Thinking Machines Lab und kündigte schlicht an: „thinking machines…die Leute sind unglaublich.“ Im Januar 2026, nach dem Ausscheiden von Barret Zoph (der zu OpenAI zurückkehrte), ernannte Murati Chintala zum CTO. Murati beschrieb ihn als „einen brillanten und erfahrenen Führer“ mit über einem Jahrzehnt grundlegender Beiträge zur KI-Infrastruktur. Sein derzeitiger Schwerpunkt liegt auf KI-Infrastruktur, KI-Forschung und Robotik bei Thinking Machines.

Hauptbeiträge

PyTorch – Mitbegründet und fast acht Jahre lang geführt; das Open-Source-Deep-Learning-Framework, das heute von über 90 % der KI-Forscher weltweit verwendet wird und praktisch jedes führende KI-System in der Produktion antreibt. Das von Chintala vorangetriebene Design mit dynamischen Berechnungsgraphen und der Python-zentrierten API etablierte das dominierende Paradigma für das Design von ML-Frameworks.
DCGAN (arXiv 2015, mit Radford und Metz) – Einführung der tiefen konvolutionellen GAN-Architektur mit Trainingstechniken zur Stabilisierung (Batch-Normalisierung, spezifische Aktivierungsfunktionen), die GANs praktisch nutzbar machten; eines der am häufigsten zitierten Papers zur generativen Modellierung und die Grundlage für das darauffolgende Jahrzehnt der Bildgenerierungsforschung.
LAPGAN (NIPS 2015) – Eine der ersten Demonstrationen fotorealistischer Bildsynthese mit GANs unter Verwendung eines Laplace-Pyramiden-Ansatzes; trug dazu bei, die GAN-basierte generative Modellierung als gangbare Forschungsrichtung zu etablieren.
Wasserstein GAN (ICML 2017) – Einführung des Wasserstein-Distanz-Trainingsziels für GANs, was die Trainingsstabilität erheblich verbesserte und eine theoretische Fundierung lieferte; grundlegend für die nachfolgende GAN-Trainingsmethodik.
Torch-7 – Betreuung des vor-PyTorch Lua-basierten Deep-Learning-Frameworks, das von Google DeepMind, Twitter und Meta verwendet wurde; der direkte Vorgänger von PyTorch und die Community-Plattform, auf der PyTorchs Designideen zuerst getestet wurden.
convnet-benchmarks – Erstellung der Goldstandard-Benchmarking-Suite für Deep Learning (2015–2017), die von NVIDIA, AMD und Intel Nervana zur Optimierung ihrer Hardware verwendet wurde; ein frühes und einflussreiches Beispiel für offene, vergleichende ML-Systembewertung.
EBLearn – Co-Maintenance des C+±Deep-Learning-Frameworks mit Yann LeCun und Pierre Sermanet vor 2012; einer der Vorläufer des modernen ML-Framework-Ökosystems.
Heimrobotik (mit Lerrel Pinto, NYU) – Demonstrierte Zero-Shot-Haushaltsaufgabenleistung (Robot Utility Models) und skalierbares Lernen durch Demonstration in echten Haushalten (DobbE) – trug zur Evidenzbasis für einsetzbare Haushaltsroboter bei.

Auszeichnungen und Anerkennung

TIME100 AI – Aufgenommen in die Liste der einflussreichsten Menschen in der KI des Time-Magazins.
Weithin dafür verantwortlich gemacht, die moderne KI-Ära zu ermöglichen durch PyTorchs Rolle beim Training von GPT, Claude, LLaMA, Stable Diffusion und den meisten anderen führenden Modellen.
PyTorch-Community-Impact – Chintalas 8-jährige Leitung von PyTorch wird weithin als einer der folgenreichsten individuellen Beiträge zur KI-Infrastruktur anerkannt; von Kollegen als „die Softwareebene, die die gesamte KI-Branche antreibt“ beschrieben.

Wichtige Beziehungen

Yann LeCun – Graduiertenberater an der NYU; stellte Chintala bei FAIR ein; von Chintala zusammen mit Rob Fergus dafür verantwortlich gemacht, „das magische frühe FAIR aufgebaut zu haben.“ LeCuns frühe Unterstützung eines Studenten von einer nicht-prestigeträchtigen Einrichtung und seine anhaltende Zusammenarbeit mit Chintala bei FAIR waren entscheidend für Chintalas Werdegang.
Adam Paszke – Kern-Mitbegründer von PyTorch; damals ein Student in Polen, der zum PyTorch-Code beitrug und eingeladen wurde, ein Praktikum bei FAIR zu machen – ein Beispiel für Chintalas Offenheit gegenüber Mitwirkenden unabhängig von ihren Qualifikationen.
Alec Radford – FAIR-Kollege und DCGAN-Co-Autor; die GAN-Forschungsperiode bei FAIR brachte einige der am häufigsten zitierten frühen Arbeiten beider Forscher hervor.
Martin Arjovsky und Leon Bottou – Co-Autoren von Wasserstein GAN; Bottou ist ein leitender FAIR-Forscher und einer der mathematischen Urväter des Fachgebiets.
Mira Murati – Aktuelle Arbeitgeberin und CEO von Thinking Machines Lab; ernannte Chintala im Januar 2026 zum CTO.
Lerrel Pinto – NYU-Kollaborateur in der Heimrobotik; ihre gemeinsame Arbeit repräsentiert Chintalas intensivsten Forschungsschwerpunkt außerhalb der ML-Infrastruktur.
Mark Zuckerberg und Mike Schroepfer (Schrep) – Chintalas Abschiedspost dankte beiden ausdrücklich dafür, dass sie „glauben, dass Open-Sourcing grundlegend wichtig und eine solide Geschäftsstrategie ist“ – womit Open Source als gemeinsame Überzeugung und nicht als Top-Down-Strategie dargestellt wird.

Persönlicher Stil

Chintalas berufliche Werte lassen sich direkt aus der Liste der Prinzipien auf seiner persönlichen Website ablesen: Er „liebt Faulheit“ (automatisiere alles Unerwünschte), „liebt Einfachheit“, „vermeidet Spielzeug- oder hypothetische Probleme“ und „liebt Open Source leidenschaftlich.“ Der letzte Punkt ist der biografischste: Er führt sein Engagement für Open Source darauf zurück, dass er ohne einfachen Zugang zu Wissen aufgewachsen ist und die offene Veröffentlichung von Werkzeugen als eine Möglichkeit sieht, „die Spielregeln anzugleichen.“ Sein Community-Management-Stil – Tausende von Forenfragen zu beantworten, erreichbar zu bleiben, Beiträge von Studenten in Polen und Doktoranden auf der NeurIPS willkommen zu heißen – spiegelt denselben egalitären Instinkt wider, der PyTorchs Community zum Erfolg verhalf. Seine Beschreibung des Abschieds von Meta fängt eine Spannung ein, die sich durch seine gesamte Karriere zieht: der Zug zwischen institutionellem Einfluss (das Framework zu leiten, das die gesamte KI antreibt) und der kreativen Freiheit, etwas Kleines und Unbequemes zu bauen. Seine Entscheidung, aus Neugier zu gehen, anstatt aus Macht zu bleiben, ist konsistent mit den Werten, die er durchgehend artikuliert hat.