Eric Jang

Ingénieur de recherche et roboticien américain, connu pour avoir co-inventé la distribution Gumbel-Softmax et pour avoir dirigé le développement de l’IA des robots humanoïdes chez 1X Technologies.


Profil

Nationalité Américaine
Formation ScB en mathématiques appliquées et informatique ; ScM en informatique — Université Brown (2012–2016)
Institution précédente Google / Robotics at Google (Google DeepMind Robotics)
Domaines de recherche Robotique, apprentissage par imitation, apprentissage par renforcement, modèles génératifs, modèles de base pour la robotique
Site personnel evjang.com
X / Twitter @ericjang11
GitHub ericjang
Google Scholar Eric Jang

Présentation générale

Eric Jang est un chercheur et ingénieur américain dont les travaux couvrent l’intersection de la théorie de l’apprentissage profond et de la robotique physique. Il est surtout connu comme co-inventeur de la distribution Gumbel-Softmax (Concrète) — une technique fondamentale permettant la rétropropagation à travers des échantillons catégoriels discrets — publiée à l’ICLR 2017 et désormais omniprésente dans la modélisation générative et la prédiction structurée. Chez Robotics at Google, il a passé six ans à appliquer la philosophie de passage à l’échelle de l’apprentissage profond à grande échelle à la manipulation physique, contribuant à des projets majeurs comme SayCan, QT-Opt, Grasp2Vec et BC-Z. De 2022 à début 2026, il a occupé le poste de Vice-Président de l’IA chez 1X Technologies (anciennement Halodi Robotics), où il a constitué l’équipe IA de zéro et supervisé le développement du modèle d’IA Redwood et du World Model 1X pour le robot humanoïde NEO. Il a quitté 1X en janvier 2026 et se trouve actuellement dans une période qu’il décrit comme une « année sabbatique », explorant de nouvelles directions dans la recherche en IA et en robotique.


Jeunesse et formation

Jang a fréquenté l’Université Brown de 2012 à 2016, obtenant un ScB en mathématiques appliquées et informatique et un ScM en informatique en simultané. Entre 2013 et 2015, il a effectué des stages chez Pixar, Google et Two Sigma, des expériences qu’il a décrites plus tard comme formatrices pour aiguiser ses instincts en matière de recherche appliquée à la frontière entre la théorie et l’ingénierie. Ses premiers articles de blog sur les réseaux de neurones — incluant des implémentations détaillées de GAN et d’auto-encodeurs variationnels en TensorFlow — ont établi son profil public dans la communauté du machine learning alors qu’il était encore étudiant.


Carrière

Robotics at Google / Google DeepMind Robotics (2016–2022)

Jang a rejoint Google en 2016 en tant que chercheur scientifique senior au sein de l’équipe Robotique, poste qu’il a occupé pendant six ans. Ses recherches se sont concentrées sur l’application du principe selon lequel des données riches combinées à des algorithmes d’apprentissage simples et à une puissance de calcul élevée surpassent les systèmes conçus à la main — cette fois-ci dans le domaine de la robotique.

Sa contribution individuelle la plus citée de cette période est la co-invention de la distribution Gumbel-Softmax (avec Shixiang Gu et Ben Poole), une méthode d’échantillonnage différenciable à partir de distributions catégorielles, publiée dans Categorical Reparameterization with Gumbel-Softmax à l’ICLR 2017. La technique a été découverte simultanément et indépendamment par Chris Maddison, Andriy Mnih et Yee Whye Teh chez DeepMind, qui l’ont nommée la distribution Concrète ; les deux articles sont désormais des citations standard dans les travaux impliquant des variables latentes discrètes.

Côté robotique, il a co-dirigé l’équipe Google Brain Moonshot — un groupe de plus de 20 chercheurs — qui a produit SayCan (Do As I Can, Not As I Say, 2022), un système ancrant le raisonnement des grands modèles de langage dans les affordances robotiques pour permettre la manipulation mobile à long horizon dans des environnements de cuisine réels. Il a également contribué à QT-Opt, un système d’apprentissage par renforcement profond à grande échelle pour la saisie basée sur la vision ; Grasp2Vec, qui a permis la saisie d’instances via l’apprentissage de représentations auto-supervisé ; Time Contrastive Networks (TCN) pour l’imitation cross-embodiment ; et BC-Z, un système de généralisation de tâches zero-shot via le clonage de comportement sur des démonstrations conditionnées par le langage. Il a également développé Tensor2Robot, un framework de ML utilisé par l’équipe de manipulation robotique et Everyday Robots.

Il a été area chair pour ICML, CoRL et NeurIPS, et a été reviewer pour de nombreux autres événements durant cette période.

1X Technologies / Halodi Robotics (2022–2026)

Un point d’inflexion clé pour l’entreprise est survenu en 2022 lorsque Halodi a commencé à fusionner son matériel humanoïde avec des approches d’IA modernes, en embauchant l’ancien chercheur de Google Brain Eric Jang comme premier employé basé en Californie. En mars 2023, Halodi a été rebaptisé 1X Technologies et a bouclé un tour de table de série A de 23,5 millions de dollars mené par l’OpenAI Startup Fund.

Jang et sa première recrue ont travaillé depuis son garage pendant plusieurs mois pour économiser de l’argent avant que l’entreprise n’étende sa présence dans la Bay Area. En tant que VP de l’IA, il a constitué l’équipe responsable des contrôleurs de corps entier par apprentissage par renforcement, des modèles vision-langage-action (VLA), des modèles vision-langage (VLM), des modèles du monde, de l’infrastructure de simulation et du moteur de données pour les robots EVE et NEO. Il a dirigé le développement de Redwood AI, un modèle d’IA embarqué de bout en bout pour le robot humanoïde NEO, que 1X a décrit comme l’un des premiers systèmes de manipulation mobile intégrés pour robots bipèdes. Il a également supervisé le World Model 1X (1XWM), un noyau cognitif génératif permettant au robot de simuler des tâches avant de les exécuter.

Le mandat de Jang a été marqué par une philosophie axée sur les données qui a remis en question les paradigmes robotiques traditionnels, et son départ en janvier 2026 est intervenu à un moment fort alors que 1X dévoilait une évolution majeure de son modèle du monde.

Année sabbatique (2026–présent)

Après son départ de 1X, Jang est entré dans ce qu’il décrit comme une année sabbatique. Il a réimplémenté des articles sur l’apprentissage profond, a voyagé en Chine pour rencontrer des entreprises de l’écosystème robotique chinois, et travaille sur un vaste projet tutoriel pour son blog. Son projet public actuel, AutoGo, consiste à reconstruire AlphaGo à partir de zéro en utilisant des outils d’IA modernes, ce qu’il a présenté dans une interview technique longue et un tutoriel d’accompagnement. Son article de blog « Leaving 1X » articulait une thèse sur la prochaine génération d’« objets magiques » en IA — modèles vidéo génératifs, systèmes de raisonnement — qui, selon lui, débloqueront de nouvelles possibilités pour la robotique.


Contributions clés

  • Gumbel-Softmax / Distribution Concrète — Co-inventé (avec Shixiang Gu et Ben Poole) un estimateur de gradient permettant la rétropropagation à travers des échantillons discrets catégoriels, publié à l’ICLR 2017. Confirmé simultanément et indépendamment par l’article « Concrete Distribution » de DeepMind. Désormais un outil standard pour l’entraînement de modèles avec variables latentes discrètes.

  • SayCan — Do As I Can, Not As I Say (2022) — A co-dirigé l’équipe Brain Moonshot de plus de 20 chercheurs qui a ancré la planification des grands modèles de langage dans les fonctions de valeur d’un robot réel, permettant des centaines de tâches de manipulation mobile à long horizon dans des environnements de cuisine. L’un des articles les plus cités sur l’ancrage des LLM dans la robotique.

  • BC-Z: Zero-Shot Task Generalisation with Robotic Imitation Learning (2021) — A démontré que le clonage de comportement sur des démonstrations téléopérées conditionnées par le langage permet la généralisation à des instructions de tâches non vues ; a introduit des motifs de conception clés, notamment le découpage en actions et les têtes de prédiction auxiliaires, qui sont devenus des ingrédients standards dans les modèles vision-langage-action ultérieurs.

  • QT-Opt: Scalable Deep RL for Vision-Based Robotic Manipulation (2018) — Système d’apprentissage par renforcement à grande échelle pour la saisie à partir d’images RVB monoculaires sur du matériel robotique réel, démontrant des comportements émergents, notamment l’isolation d’objets et les tentatives après échec.

  • Time Contrastive Networks (TCN) (2017) — A proposé un apprentissage de représentation non supervisé multi-points de vue pour l’imitation robotique, permettant à un robot d’imiter un comportement de versement humain à partir d’une seule vidéo de démonstration sans correspondance explicite.

  • Grasp2Vec (2018) — Saisie d’instance auto-supervisée sans étiquetage d’objets, apprenant des représentations d’objets via les propres interactions de saisie du robot.

  • Tensor2Robot — Framework ML open source pour l’équipe de manipulation robotique de Google, standardisant les pipelines d’entraînement de modèles au sein du groupe.

  • Tutoriels sur les Normalizing Flows (2018) — Tutoriel de blog en deux parties introduisant les normalizing flows à un large public de ML, implémenté en JAX. Est devenu l’une des introductions informelles les plus citées sur le sujet et a contribué à populariser à la fois la technique et JAX au moment du développement précoce de cette dernière.

  • AutoGo (2026) — Projet open source reconstruisant AlphaGo à partir de zéro en utilisant des outils d’IA modernes ; exploration pédagogique de MCTS, du jeu contre soi-même et de leur relation avec le raisonnement des LLM, documentée dans un tutoriel et présentée dans une discussion technique publique longue.


Prix et reconnaissances

  • Acceptation à l’ICLR 2017 — Article sur Gumbel-Softmax accepté sous forme de poster dans l’un des événements les plus sélectifs du domaine.
  • Article dans WIRED — Les travaux sur l’ouverture de portes verrouillées avec des réseaux de neurones ont été présentés dans le magazine WIRED.
  • Articles sur le blog Google AI — De nombreux projets (Semantic Grasping, QT-Opt, Grasp2Vec, RetinaGAN, BC-Z) ont été présentés sur le blog Google AI, une reconnaissance interne de la recherche à fort impact.
  • Area Chair — Reconnu comme area chair par ICML, CoRL et NeurIPS.

Relations clés

  • Shixiang Gu et Ben Poole — Co-auteurs de l’article sur Gumbel-Softmax ; Gu a introduit l’astuce Gumbel-Max, Poole a contribué aux expériences semi-supervisées et aux dérivations mathématiques.
  • Sergey Levine — Collaborateur fréquent chez Google sur QT-Opt, Grasp2Vec et BC-Z ; figure de proue dans l’apprentissage robotique.
  • Vincent Vanhoucke — Principal de Google Brain qui a encouragé Jang à poursuivre l’idée de Gumbel-Softmax ; co-auteur sur Semantic Grasping et QT-Opt.
  • Chris Maddison, Andriy Mnih et Yee Whye Teh — Co-découvreurs indépendants de la distribution Concrète chez DeepMind ; la découverte simultanée est un épisode notable de l’histoire du ML.
  • Berndt Børnich — PDG et fondateur de 1X Technologies ; Jang a rejoint l’entreprise de Børnich en tant que premier employé en Californie et a contribué à la réalisation du pivot de l’entreprise vers les robots humanoïdes domestiques.
  • Dwarkesh Patel — A animé un podcast long avec Jang en mai 2026 couvrant AlphaGo, MCTS et le RL dans les LLM ; la conversation a également réfléchi à la relation entre la recherche et l’apprentissage de manière plus large.

Style personnel

Jang écrit avec une franchise inhabituelle sur les réalités pratiques de la recherche et les décisions de carrière — ses articles de blog sur son départ de Google Brain et de 1X sont des récits à la première personne, francs, des raisonnements et des incertitudes impliqués, un registre rare dans un domaine dominé par une communication de type annonce. Sa sensibilité technique est ancrée dans une conviction qu’il appelle la perspective de la « Leçon amère » : des données riches combinées à des algorithmes simples et évolutifs surpassent systématiquement une ingénierie minutieuse, et identifier le prochain « objet magique » — une nouvelle famille de modèles ou une capacité avec une généralisation surprenante — est l’acte au plus fort effet de levier dans la recherche en IA. C’est un blogueur technique prolifique avec une voix distinctive qui mêle des détails d’ingénierie au niveau des systèmes à des spéculations philosophiques plus larges sur l’intelligence, la simulation et le calcul. Son public reflète un auditoire qui va des praticiens en quête de tutoriels aux chercheurs intéressés par sa perspective sur la direction de l’IA incarnée.


Références