Eric Jang

ref · 26. Mai 2026 um 01:54

Amerikanischer Forscher im Bereich Robotik und Ingenieur, bekannt für die Miterfindung der Gumbel-Softmax-Verteilung und für die Leitung der KI-Entwicklung humanoider Roboter bei 1X Technologies.

Profil


Nationalität	Amerikanisch
Ausbildung	ScB in Angewandter Mathematik und Informatik; ScM in Informatik — Brown University (2012–2016)
Vorherige Institution	Google / Robotics at Google (Google DeepMind Robotics)
Forschungsbereiche	Robotik, Imitationslernen, Bestärkendes Lernen, Generative Modelle, Grundlagenmodelle für die Robotik
Persönliche Website	evjang.com
X / Twitter	@ericjang11
GitHub	ericjang
Google Scholar	Eric Jang

Überblick

Eric Jang ist ein amerikanischer Forscher und Ingenieur, dessen Arbeit an der Schnittstelle von Deep-Learning-Theorie und physischer Robotik liegt. Er ist vor allem als Miterfinder der Gumbel-Softmax- (Concrete-) Verteilung bekannt – einer grundlegenden Technik, die die Rückpropagierung durch diskrete kategoriale Stichproben ermöglicht – veröffentlicht auf der ICLR 2017 und heute allgegenwärtig im Bereich generativer Modellierung und struktureller Vorhersage. Bei Robotics at Google verbrachte er sechs Jahre damit, die Skalierungsphilosophie des Deep Learning mit großen Modellen auf die physische Manipulation anzuwenden, und trug zu wegweisenden Projekten wie SayCan, QT-Opt, Grasp2Vec und BC-Z bei. Von 2022 bis Anfang 2026 war er Vizepräsident für KI bei 1X Technologies (ehemals Halodi Robotics), wo er das KI-Team von Grund auf aufbaute und die Entwicklung des KI-Modells Redwood sowie des 1X World Model für den humanoiden Roboter NEO leitete. Er verließ 1X im Januar 2026 und befindet sich derzeit in einem selbst beschriebenen Sabbatical, um neue Richtungen in der KI- und Robotikforschung zu erkunden.

Frühes Leben & Ausbildung

Jang studierte von 2012 bis 2016 an der Brown University und absolvierte gleichzeitig einen ScB in Angewandter Mathematik und Informatik sowie einen ScM in Informatik. Zwischen 2013 und 2015 absolvierte er Praktika bei Pixar, Google und Two Sigma, Erfahrungen, die er später als prägend für seinen Instinkt für angewandte Forschung an der Grenze zwischen Theorie und Technik beschrieb. Seine frühen Blogartikel über neuronale Netze – darunter detaillierte Implementierungen von GANs und variational autoencoders in TensorFlow – begründeten sein öffentliches Profil in der ML-Community, als er noch Student war.

Karriere

Robotics at Google / Google DeepMind Robotics (2016–2022)

Jang kam 2016 als Senior Research Scientist zum Robotics-Team von Google, eine Rolle, die er sechs Jahre lang innehatte. Seine Forschung konzentrierte sich auf die Anwendung des Prinzips, dass reichhaltige Daten in Kombination mit einfachen Lernalgorithmen und leistungsstarker Rechenleistung handgefertigte Systeme übertreffen – diesmal im Bereich der Robotik.

Sein meistzitierter individueller Beitrag aus dieser Zeit war die Miterfindung der Gumbel-Softmax-Verteilung (mit Shixiang Gu und Ben Poole), einer Methode zum differenzierbaren Sampling aus kategorialen Verteilungen, veröffentlicht als Categorical Reparameterization with Gumbel-Softmax auf der ICLR 2017. Die Technik wurde zeitgleich und unabhängig von Chris Maddison, Andriy Mnih und Yee Whye Teh bei DeepMind entdeckt, die sie als Concrete Distribution bezeichneten; beide Arbeiten sind heute Standardzitate in Arbeiten, die diskrete latente Variablen verwenden.

Auf der Robotikseite leitete er das Google Brain Moonshot Team – eine Gruppe von mehr als 20 Forschern – das SayCan (Do As I Can, Not As I Say, 2022) hervorbrachte, ein System, das die Argumentation großer Sprachmodelle in robotischen Handlungsmöglichkeiten verankert, um langfristige mobile Manipulation in realen Küchenumgebungen zu ermöglichen. Er trug auch zu QT-Opt bei, einem groß angelegten Deep-RL-System für visuell basiertes Greifen; zu Grasp2Vec, das instanzbasiertes Greifen durch selbstüberwachtes Repräsentationslernen ermöglichte; zu Time Contrastive Networks (TCN) für die nachahmende lernübergreifende Verkörperung; und zu BC-Z, einem System zur Zero-Shot-Aufgabengeneralisierung durch Verhaltensklonen von sprachgesteuerten Demonstrationen. Er entwickelte auch Tensor2Robot, ein ML-Framework, das vom Robotik-Manipulationsteam und von Everyday Robots verwendet wurde.

Während dieser Zeit war er als Area Chair für ICML, CoRL und NeurIPS tätig und hat für zahlreiche andere Konferenzen Gutachten erstellt.

1X Technologies / Halodi Robotics (2022–2026)

Ein entscheidender Wendepunkt für das Unternehmen kam im Jahr 2022, als Halodi begann, seine humanoide Hardware mit modernen KI-Ansätzen zu verschmelzen, und den ehemaligen Google-Brain-Forscher Eric Jang als ersten Angestellten in Kalifornien einstellte. Im März 2023 benannte sich Halodi in 1X Technologies um und schloss eine Serie-A-Finanzierungsrunde in Höhe von 23,5 Millionen US-Dollar unter der Leitung des OpenAI Startup Fund ab.

Jang und sein erster Mitarbeiter arbeiteten mehrere Monate lang von seiner Garage aus, um Geld zu sparen, bevor das Unternehmen seine Präsenz in der Bay Area ausbaute. Als VP of AI baute er das Team auf, das für die Entwicklung von Ganzkörpercontrollern durch bestärkendes Lernen, von Vision-Language-Action-Modellen (VLAs), Vision-Language-Modellen (VLMs), Weltmodellen, Simulationsinfrastruktur und der Daten-Engine für die Roboter EVE und NEO verantwortlich war. Er leitete die Entwicklung von Redwood AI, einem End-to-End-Bord-KI-Modell für den humanoiden Roboter NEO, das von 1X als eines der ersten vereinheitlichten Ganzkörper-Mobilmanipulationssysteme für zweibeinige Roboter beschrieben wurde. Er beaufsichtigte auch das 1X World Model (1XWM), einen generativen kognitiven Kern, der es dem Roboter ermöglicht, Aufgaben zu simulieren, bevor er sie ausführt.

Jangs Amtszeit war geprägt von einer datenzentrierten Philosophie, die traditionelle Robotik-Paradigmen in Frage stellte, und sein Ausscheiden im Januar 2026 erfolgte zu einem Höhepunkt, als 1X eine bedeutende Weiterentwicklung seines Weltmodells vorstellte.

Sabbatical (2026–heute)

Nach seinem Ausscheiden bei 1X begann Jang ein selbst beschriebenes Sabbatical. Er hat Deep-Learning-Arbeiten neu implementiert, ist nach China gereist, um Unternehmen im chinesischen Robotik-Ökosystem zu treffen, und arbeitet an einem großen Tutorial-Projekt für seinen Blog. Sein derzeitiges öffentlich zugängliches Projekt, AutoGo, beinhaltet den Wiederaufbau von AlphaGo von Grund auf unter Verwendung moderner KI-Tools, was er in einem ausführlichen technischen Interview und einem begleitenden Tutorial vorstellte. In seinem Blogbeitrag „Leaving 1X“ formulierte er eine These über die nächste Generation von „magischen Objekten“ in der KI – generative Videomodelle, Argumentationssysteme – von denen er glaubt, dass sie neue Möglichkeiten für die Robotik eröffnen werden.

Wichtigste Beiträge

Gumbel-Softmax / Concrete Distribution — Miterfunden (mit Shixiang Gu und Ben Poole) einen Gradientenschätzer, der die Rückpropagierung durch diskrete kategoriale Stichproben ermöglicht, veröffentlicht auf der ICLR 2017. Zeitgleich mit und unabhängig bestätigt durch das Papier „Concrete Distribution“ von DeepMind. Heute ein Standardwerkzeug für das Training von Modellen mit diskreten latenten Variablen.
SayCan — Do As I Can, Not As I Say (2022) — Co-Leitung des Brain Moonshot Teams mit über 20 Forschern, das die Planung großer Sprachmodelle in den Wertefunktionen eines echten Roboters verankerte und so Hunderte von langfristigen mobilen Manipulationsaufgaben in Küchenumgebungen ermöglichte. Eines der am häufigsten zitierten Papiere zur Verankerung von LLMs in der Robotik.
BC-Z: Zero-Shot Task Generalisation with Robotic Imitation Learning (2021) — Zeigte, dass Verhaltensklonen von sprachgesteuerten teleoperierten Demonstrationen die Generalisierung auf unbekannte Aufgabenanweisungen ermöglicht; führte wichtige Designmuster wie Action Chunking und auxiliary prediction heads ein, die zu Standardbestandteilen späterer Vision-Language-Action-Modelle wurden.
QT-Opt: Scalable Deep RL for Vision-Based Robotic Manipulation (2018) — Groß angelegtes bestärkendes Lernsystem zum Greifen von monokularen RGB-Bildern auf echter Roboterhardware, das emergente Verhaltensweisen wie das Vereinzeln von Objekten und das Wiederholen nach Fehlschlägen demonstrierte.
Time Contrastive Networks (TCN) (2017) — Schlug unüberwachtes Multi-Viewpoint-Repräsentationslernen für die robotische Nachahmung vor, das es einem Roboter ermöglicht, menschliches Gießverhalten aus einem einzigen Demonstrationsvideo ohne explizite Korrespondenz zu imitieren.
Grasp2Vec (2018) — Selbstüberwachtes Instanzgreifen ohne Objektkennzeichnung, das Objektrepräsentationen durch die eigenen Greifinteraktionen des Roboters lernt.
Tensor2Robot — Open-Source-ML-Framework für das Google Robotics-Manipulationsteam, das die Modelltrainingspipelines innerhalb der Gruppe standardisierte.
Normalizing Flows Tutorials (2018) — Zweiteiliges Blog-Tutorial, das Normalizing Flows einem breiten ML-Publikum vorstellte, implementiert in JAX. Wurde zu einer der am weitesten verbreiteten informellen Einführungen in das Thema und trug dazu bei, sowohl die Technik als auch JAX zum Zeitpunkt der frühen Entwicklung des letzteren zu popularisieren.
AutoGo (2026) — Open-Source-Projekt, das AlphaGo mit modernen KI-Tools von Grund auf neu aufbaut; eine pädagogische Erkundung von MCTS, Self-Play und deren Beziehung zum LLM-Reasoning, dokumentiert in einem Tutorial und präsentiert in einer ausführlichen öffentlichen technischen Diskussion.

Auszeichnungen & Anerkennung

Annahme auf der ICLR 2017 — Das Gumbel-Softmax-Papier wurde als Poster auf einer der selektivsten Konferenzen des Fachgebiets angenommen.
WIRED-Beitrag — Die Arbeit zum Öffnen von verriegelten Türen mit neuronalen Netzen wurde im Magazin WIRED vorgestellt.
Google AI Blog-Beiträge — Mehrere Projekte (Semantic Grasping, QT-Opt, Grasp2Vec, RetinaGAN, BC-Z) wurden im Google AI Blog vorgestellt, einer internen Anerkennung für Forschung mit hoher Wirkung.
Area Chair — Wurde von ICML, CoRL und NeurIPS als Area Chair ausgezeichnet.

Wichtige Beziehungen

Shixiang Gu & Ben Poole — Koautoren des Gumbel-Softmax-Papiers; Gu führte den Gumbel-Max-Trick ein, Poole steuerte die halbüberwachten Experimente und mathematischen Ableitungen bei.
Sergey Levine — Häufiger Mitarbeiter bei Google an QT-Opt, Grasp2Vec und BC-Z; eine führende Persönlichkeit im Bereich Robotik-Lernen.
Vincent Vanhoucke — Google Brain-Leiter, der Jang ermutigte, die Gumbel-Softmax-Idee zu verfolgen; Koautor bei Semantic Grasping und QT-Opt.
Chris Maddison, Andriy Mnih & Yee Whye Teh — Unabhängige Mitentdecker der Concrete Distribution bei DeepMind; die gleichzeitige Entdeckung ist eine bemerkenswerte Episode in der ML-Geschichte.
Berndt Børnich — CEO und Gründer von 1X Technologies; Jang trat Børnichs Unternehmen als erster Angestellter in Kalifornien bei und half bei der Umsetzung der Neuausrichtung des Unternehmens auf Haushaltshumanoide.
Dwarkesh Patel — Hat im Mai 2026 einen ausführlichen Podcast mit Jang moderiert, der AlphaGo, MCTS und RL in LLMs abdeckte; das Gespräch reflektierte auch die Beziehung zwischen Suche und Lernen im weiteren Sinne.

Persönlicher Stil

Jang schreibt mit ungewöhnlicher Direktheit über die praktischen Realitäten von Forschung und Karriereentscheidungen – seine Blogbeiträge über das Verlassen von Google Brain und das Verlassen von 1X sind offene Ich-Erzählungen über die damit verbundenen Überlegungen und Unsicherheiten, eine seltene Textsorte in einem von Ankündigungen dominierten Feld. Seine technische Sensibilität gründet in einer Überzeugung, die er die „Bittere Lektion“-Perspektive nennt: Reiche Daten, kombiniert mit einfachen skalierbaren Algorithmen, schlagen konsequent sorgfältiges Engineering, und das Identifizieren des nächsten „magischen Objekts“ – einer neuen Modellfamilie oder Fähigkeit mit überraschender Generalisierung – ist der wirkungsvollste Akt in der KI-Forschung. Er ist ein produktiver technischer Blogger mit einer unverwechselbaren Stimme, die systemtechnische Details mit breiteren philosophischen Spekulationen über Intelligenz, Simulation und Berechnung vermischt. Seine öffentliche Anhängerschaft spiegelt ein Publikum wider, das von Praktikern, die Tutorials suchen, bis zu Forschern reicht, die an seiner Perspektive auf die Richtung der verkörperten KI interessiert sind.

Referenzen

Persönliche Website und Blog: evjang.com
About-Seite: evjang.com/about
Projekte und Publikationen: evjang.com/projects
Google Scholar: scholar.google.com — Eric Jang
X-Profil: digg.com/u/x/ericjang11
„Leaving 1X“ (Januar 2026): evjang.com/2026/01/21/leaving-1x.html
Gumbel-Softmax-Papier — arXiv 1611.01144: arxiv.org/abs/1611.01144
Dwarkesh Patel Podcast — „Eric Jang: Building AlphaGo from Scratch“ (Mai 2026): dwarkesh.com/p/eric-jang
Contrary Research — 1X Business Breakdown: research.contrary.com/company/1x