Lilian Weng

Ancienne vice-présidente de la recherche et de la sécurité chez OpenAI, co-fondatrice de Thinking Machines Lab, et autrice de Lil’Log — le blog technique d’apprentissage automatique le plus lu dans le domaine, rédigé depuis 2017 comme notes d’apprentissage personnelles et devenu une référence standard dans toute la communauté de l’IA.


Profil

Champ Détail
Nationalité Sino-américaine
Rôle actuel Co-fondatrice, Thinking Machines Lab ; « Distinguished Fellow », Fellows Fund
Domaines de recherche Sécurité de l’IA, Apprentissage par renforcement, Alignment des LLM, Récompense détournée, Agents autonomes, Robotique
Formation Licence en informatique (Chine) ; Doctorat en informatique (États-Unis) — voir note
Blog Lil’Log — lilianweng.github.io
X / Twitter @lilianweng
GitHub @lilianweng
Google Scholar scholar.google.com — plus de 48 000 citations

Note sur la formation : Les sources divergent sur les détails. Un profil mentionne une licence à l’Université Beihang et un doctorat à l’Université Carnegie Mellon ; un autre mentionne une licence à l’Université de Pékin et un doctorat à l’Université de l’Indiana à Bloomington. Aucune de ces informations n’a été confirmée par une source primaire. Sa thèse de doctorat portait sur l’apprentissage par renforcement, la robotique et les sciences des réseaux.


Aperçu

Lilian Weng est une chercheuse sino-américaine en sécurité de l’IA et l’une des autrices les plus influentes dans le domaine. Elle est surtout connue pour deux contributions parallèles qui se sont renforcées mutuellement pendant ses sept années chez OpenAI : son leadership technique dans la construction de l’infrastructure de sécurité de l’entreprise, et son blog Lil’Log, qu’elle tient depuis 2017 comme notes d’apprentissage personnelles et qui est devenu le blog technique de ML le plus lu parmi les praticiens. Elle a rejoint OpenAI en 2017/2018 dans l’équipe robotique, a travaillé sur le projet de manipulation dextre du Rubik’s Cube, est passée à la recherche appliquée en IA, a dirigé l’équipe Safety Systems (plus de 80 scientifiques), et a été nommée vice-présidente de la recherche et de la sécurité en juillet 2024 — avant de quitter l’entreprise en novembre 2024. Business Insider l’a inscrite sur sa liste 2024 des personnes les plus influentes dans l’IA. Elle est co-fondatrice de Thinking Machines Lab, la startup IA de Mira Murati, aux côtés de John Schulman, Barret Zoph, Alec Radford, et d’autres. Elle décrit la « persévérance » et l’« humilité » comme ses traits fondamentaux, tous deux issus de ses premières expériences avec les compétitions de mathématiques où elle a pris conscience des disparités de talents et a appris à aborder les problèmes difficiles en tant que « personne normale qui doit donner tout ce qu’elle a. »


Jeunesse et Formation

Weng a grandi en Chine, où elle a développé un intérêt précoce pour les mathématiques et une curiosité insatiable pour de nombreux sujets — elle a raconté avoir dévoré des encyclopédies étant enfant, de l’astronomie à l’astrologie. Elle a participé à des compétitions de mathématiques dès son plus jeune âge, une expérience à laquelle elle attribue la formation de l’« humilité » qui caractérise son travail : confrontée à des courbes de talent très marquées, elle a intériorisé que l’effort soutenu et la clarté de pensée importent plus que les avantages innés.

Elle a obtenu une licence en informatique en Chine (Université Beihang selon un profil ; Université de Pékin selon un autre) puis un doctorat en informatique aux États-Unis, avec des recherches couvrant l’apprentissage par renforcement, la robotique et les sciences des réseaux. Son intérêt pour l’apprentissage profond, qu’elle a découvert après son doctorat, a allumé la curiosité qui l’a finalement menée à OpenAI.


Carrière

Expérience industrielle pré-OpenAI

Avant de rejoindre OpenAI, Weng a travaillé comme data scientist et ingénieure logiciel dans plusieurs entreprises de la Silicon Valley, notamment Meta (alors Facebook), Dropbox et Affirm. Elle a également été décrite comme ayant occupé un poste de chercheuse scientifique chez Snapchat. Cette expérience pratique d’ingénierie — construire des systèmes de ML en environnement de production avant d’entrer dans un laboratoire de recherche en IA — a façonné son approche résolument appliquée des questions de sécurité et d’alignement : elle a toujours cadré la sécurité non pas comme une préoccupation théorique mais comme un défi d’ingénierie produit.

OpenAI (fin 2017 / 2018–2024)

Équipe Robotique (2018–2021)
Le premier rôle de Weng chez OpenAI était dans l’équipe robotique, travaillant sur certains des problèmes d’IA physique les plus exigeants des débuts de l’entreprise. Le projet phare était le système de manipulation dextre du Rubik’s Cube — un effort pluriannuel pour entraîner une main robotique par apprentissage par renforcement à résoudre le puzzle, démontré publiquement en 2019 en utilisant la randomisation de domaine sur des centaines de configurations simulées pour parvenir à un transfert vers le robot physique. Elle a décrit l’intensité émotionnelle de la recherche matérielle : « mener des expériences physiques est une expérience extrêmement excitante, difficile et émotionnelle. » La période robotique a ancré son travail ultérieur sur la sécurité dans une compréhension pratique des modes de défaillance de l’apprentissage par renforcement, du détournement de récompense et de l’écart entre simulation et déploiement physique.

Équipe de Recherche Appliquée en IA (2021–2023)
En 2021, Weng est passée à l’équipe de recherche appliquée en IA d’OpenAI, où elle a dirigé la recherche reliant les capacités émergentes des modèles de langage de l’entreprise aux applications aval. Cette période a coïncidé avec le développement de ChatGPT et GPT-4 et a nécessité de combiner une compréhension de niveau recherche du comportement des modèles avec la perspective d’ingénierie appliquée pour faire fonctionner les systèmes de manière fiable et sécurisée dans des contextes destinés aux utilisateurs.

Responsable de l’Équipe Safety Systems (2023–2024)
En 2023, Weng a été chargée de diriger l’équipe Safety Systems d’OpenAI — à son apogée, composée de plus de 80 scientifiques, chercheurs et experts en politiques. Le mandat de l’équipe était de protéger contre les risques des modèles de frontière, y compris les attaques adversariales, les jailbreaks, le détournement de récompense dans l’entraînement RLHF, et l’évaluation de scénarios de risque catastrophique. Elle a également siégé au comité de sécurité et de sûreté du conseil d’administration, lui donnant une responsabilité de surveillance institutionnelle formelle sur les décisions de sécurité au plus haut niveau de la gouvernance d’OpenAI.

Vice-Présidente de la Recherche et de la Sécurité (juillet–novembre 2024)
Suite au départ d’Aleksander Madry, responsable de la sécurité, Weng a été nommée vice-présidente de la recherche et de la sécurité en juillet 2024, consolidant la recherche en sécurité chez OpenAI sous une direction unique. Son mandat comprenait à la fois la gestion des systèmes de sécurité existants et l’expansion des évaluations de préparation pour les futurs modèles. Cette nomination est intervenue dans le contexte d’une vague plus large de départs liés à la sécurité chez OpenAI, dont Jan Leike, John Schulman et Mira Murati.

Le 15 novembre 2024, Weng a annoncé son départ sur X : « Après 7 ans chez OpenAI, je me sens prête à me recentrer et à explorer quelque chose de nouveau. J’ai pris la décision extrêmement difficile de quitter OpenAI. En regardant ce que nous avons accompli, je suis très fière de chacun dans l’équipe Safety Systems et j’ai une confiance extrêmement élevée dans le fait que l’équipe continuera à prospérer. »

Thinking Machines Lab — Co-fondatrice (2025–présent)

Weng est co-fondatrice de Thinking Machines Lab, lancée par l’ancienne CTO d’OpenAI, Mira Murati, début 2025. L’équipe fondatrice comprend John Schulman, Alec Radford, Barret Zoph et plusieurs autres anciens d’OpenAI. Thinking Machines Lab se positionne comme un laboratoire de recherche et de développement de produits IA axé sur la collaboration homme-IA. Le parcours de Weng dans les systèmes de sécurité, la recherche appliquée en IA et la robotique correspond directement à l’agenda du laboratoire.

Fellows Fund — « Distinguished Fellow » (décembre 2024)

En décembre 2024, Fellows Fund, une firme de capital-risque spécialisée dans l’IA, a annoncé Weng comme « Distinguished Fellow ». Elle a déclaré : « La mission et la vision de Fellows Fund sont très convaincantes. Je suis honorée de rejoindre ce groupe de AI Fellows pour soutenir la prochaine génération de fondateurs dans l’IA. »


Lil’Log (lilianweng.github.io)

Lil’Log est le blog technique personnel de Weng, lancé en 2017. Elle décrit son origine simplement sur la page d’accueil : « Je documente mes notes d’apprentissage dans ce blog depuis 2017. » Ce qui a commencé comme une pratique personnelle pour consolider sa propre compréhension est devenu, au fil des années, l’une des ressources les plus liées et citées dans la communauté de la recherche et de l’ingénierie en ML — une première référence canonique pour les praticiens rencontrant de nouveaux sujets.

L’autorité du blog repose sur une combinaison de profondeur exceptionnelle, de clarté pédagogique et d’actualité de la recherche. Les articles durent généralement 20 à 45 minutes, couvrent systématiquement la littérature pertinente avec une notation formelle et sont mis à jour à mesure que le domaine évolue. Ils ne fonctionnent ni comme de simples tutoriels ni comme de pures revues de littérature, mais comme quelque chose de plus proche de l’explication idéale d’un sujet par un étudiant diplômé — techniquement rigoureuse, autonome et animée par une curiosité authentique de comprendre plutôt que par la performance.

Articles majeurs sélectionnés :

Article Date Signification
A (Long) Peek into Reinforcement Learning Fév. 2018 Aperçu complet de l’apprentissage par renforcement ; largement utilisé comme référence de cours
Meta-Learning: Learning to Learn in Few Steps Nov. 2018 Introduction canonique au méta-apprentissage
Domain Randomization for Sim-to-Real Transfer Mai 2019 Explication technique détaillée du contexte de recherche en robotique de Weng
What are Diffusion Models? Juil. 2021 Devenue l’introduction standard aux modèles de diffusion avant Stable Diffusion ; mise à jour à plusieurs reprises jusqu’en 2024
Contrastive Representation Learning Mai 2021 Enquête complète sur l’apprentissage auto-supervisé
How to Train Really Large Models on Many GPUs? Sep. 2021 Co-écrit une version améliorée avec Greg Brockman sur le blog d’OpenAI
Large Transformer Model Inference Optimization Jan. 2023 Systématisé la littérature sur l’efficacité de l’inférence
Prompt Engineering Mar. 2023 L’une des introductions les plus lues dans le domaine ; caractérisé comme « science empirique »
LLM Powered Autonomous Agents Juin 2023 Défini le cadre agent planification/mémoire/utilisation d’outils qui est devenu dominant dans la recherche ultérieure sur les agents
Adversarial Attacks on LLMs Oct. 2023 Enquête complète sur le jailbreaking et la robustesse aux attaques adversariales
Thinking about High-Quality Human Data Fév. 2024 Analyse de la qualité des annotations, de l’étiquetage RLHF et de la sous-évaluation du travail sur les données
Reward Hacking in Reinforcement Learning Nov. 2024 Son dernier article majeur de l’ère OpenAI ; a synthétisé les modes de défaillance critiques pour la sécurité
Why We Think Mai 2025 Analyse du calcul au moment du test et du raisonnement en chaîne de pensée ; a remercié John Schulman pour ses « retours et modifications directes super précieux »

L’article « LLM Powered Autonomous Agents » (juin 2023) est le travail de blog le plus cité de Weng. Il a introduit un cadre cohérent — LLM comme cerveau de l’agent, augmenté par la planification, la mémoire et l’utilisation d’outils — qui est devenu la structure conceptuelle de référence pour la conception de systèmes d’agents, tant dans les articles de recherche que dans le développement de produits. L’influence de cet article sur la façon dont le domaine décrit et construit des agents basés sur LLM est difficile à surestimer.


Contributions clés

  • Lil’Log — Sept ans d’articles de blog de ML profondément recherchés et pédagogiquement exceptionnels qui ont façonné la compréhension du domaine par toute une génération de chercheurs et d’ingénieurs ; « What are Diffusion Models? » et « LLM Powered Autonomous Agents » comptent parmi les explications de ML les plus lues jamais écrites.

  • Systèmes de sécurité d’OpenAI — A construit et dirigé l’équipe responsable de la protection des modèles de frontière d’OpenAI contre les attaques adversariales, le détournement de récompense et les risques catastrophiques ; les programmes de red teaming externe et les évaluations de préparation qu’elle a mis en place ont institutionnalisé l’évaluation structurée de la sécurité dans un laboratoire d’IA de frontière.

  • Manipulation dextre du Rubik’s Cube — Contributeur clé au projet robotique d’OpenAI démontrant la manipulation dextre dans la main grâce à l’apprentissage par renforcement avec randomisation de domaine ; un résultat marquant dans l’IA physique.

  • Recherche appliquée en IA chez OpenAI — A dirigé la transition des capacités de recherche d’OpenAI vers des systèmes appliqués, contribuant au développement de l’infrastructure d’évaluation et d’alignement sous-tendant ChatGPT et GPT-4.

  • Politique et gouvernance de la sécurité — A siégé au comité de sécurité et de sûreté du conseil d’administration d’OpenAI ; sa consolidation de la recherche en sécurité sous un seul rôle de VP représentait un engagement structurel d’OpenAI en faveur d’une supervision intégrée de la sécurité.


Prix et reconnaissance

  • Business Insider 2024 AI Power List — Nommée pour son leadership dans le développement sûr et éthique de l’IA.
  • Fellows Fund « Distinguished Fellow » (décembre 2024).
  • Plus de 48 000 citations Google Scholar — reflétant la portée à la fois de ses publications de recherche et de l’influence savante indirecte de Lil’Log.

Relations clés

  • Mira Murati — Co-fondatrice de Thinking Machines Lab ; leur création conjointe reflète une conviction partagée selon laquelle la sécurité et l’infrastructure de recherche sont inséparables d’un développement compétent de l’IA.
  • John Schulman — Co-fondateur de Thinking Machines Lab ; remercié par Weng pour ses modifications directes sur « Why We Think » (2025); collaborateur intellectuel de longue date en matière d’apprentissage par renforcement et de raisonnement.
  • Aleksander Madry — Prédécesseur à la tête des travaux de préparation à la sécurité d’OpenAI ; Weng a repris l’équipe de préparation lorsque Madry a été réaffecté en juillet 2024 avant d’être promue VP.
  • Jan Leike — Ancien responsable de la sécurité d’OpenAI dont le départ très médiatisé a précédé la nomination de Weng ; tous deux faisaient partie de la vague de départs axés sur la sécurité qui a caractérisé OpenAI en 2024.
  • Greg Brockman — A co-écrit une version améliorée de l’article de Weng « How to Train Really Large Models » pour le blog d’OpenAI ; l’un des signaux de son intégration dans la culture de communication de la recherche d’OpenAI.

Style personnel

La présence publique de Weng est définie par un paradoxe : elle est l’une des autrices techniques les plus lues dans le domaine de l’IA, mais son blog conserve le cadrage persistant de notes personnelles plutôt que d’exposé faisant autorité. Cette humilité est authentique et biographique. Elle l’a attribuée aux compétitions de mathématiques de son enfance où elle a rencontré tôt les limites de son propre talent, apprenant à aborder les problèmes difficiles de manière progressive plutôt qu’héroïque. Elle décrit ses traits fondamentaux comme la « persévérance » et l’« humilité » ; ses amis la décrivent comme « organisée » et « patiente. » L’avertissement d’ouverture du blog — mentionnant les fautes de grammaire comme preuve que ChatGPT n’est pas impliqué — signale que l’écriture est délibérée et à la première personne dans un domaine où le polissage assisté par IA est devenu la norme. Sa philosophie de la sécurité est parallèle à son épistémologie personnelle : elle a déclaré que « le passage à l’échelle n’est pas la seule recette » et que l’alignement et la sécurité sont « les défis les plus urgents en ce moment, » une position détenue non pas à partir d’une critique extérieure mais d’années de construction de ces systèmes de l’intérieur. Son profil Digg vibe (sujets dominants : apprentissage par renforcement, sécurité de l’IA, alignement des LLM) reflète une communicatrice dont l’identité publique est restée techniquement fondée tout au long de son ascension institutionnelle.


Références