Lilian Weng

前OpenAI研究与安全副总裁、Thinking Machines Lab联合创始人、Lil’Log作者——后者是业内阅读最广的技术性机器学习博客,自2017年起作为个人学习笔记撰写,后成为AI社区的标准参考文献。


简介

领域 详情
国籍 美籍华人
现任职务 Thinking Machines Lab联合创始人;Fellows Fund杰出研究员
研究方向 AI安全、强化学习、LLM对齐、奖励篡改、自主智能体、机器人学
教育背景 计算机科学学士(中国);计算机科学博士(美国)—— 参见附注
博客 Lil’Log — lilianweng.github.io
X / Twitter @lilianweng
GitHub @lilianweng
Google Scholar scholar.google.com —— 引用超过48,000次

关于教育背景的附注: 各资料源在此信息上存在矛盾。一份资料显示其本科毕业于北京航空航天大学,博士毕业于卡内基梅隆大学;另一份则显示本科毕业于北京大学,博士毕业于印第安纳大学布卢明顿分校。两者均未得到一手来源的证实。她的博士研究方向涵盖强化学习、机器人学和网络科学。


概述

Lilian Weng是一位美籍华人AI安全研究员,也是该领域最具影响力的写作者之一。她最广为人知的是在OpenAI七年期间两项相互促进的平行贡献:一是领导公司安全基础设施的技术团队,二是她自2017年起以个人学习笔记形式持续维护的博客Lil’Log,该博客已成为从业者阅读最广的技术性ML博客。她于2017/2018年加入OpenAI机器人团队,参与了魔方灵巧操作项目,之后转入应用AI研究,领导安全系统团队(80多名科学家),并于2024年7月被任命为研究与安全副总裁——随后于2024年11月离开。《商业内幕》将她列入2024年AI权力榜单。她是Thinking Machines Lab的共同创始人,这是Mira Murati的AI初创公司,联合创始人还包括John Schulman、Barret Zoph、Alec Radford等人。她将「坚持」和「谦逊」描述为自己的核心特质,这两者都源于早期参加数学竞赛的经历,当时她直面了天赋差距的现实,并学会了以「必须全力以赴的普通人」的姿态去应对难题。


早年生活与教育

Weng在中国长大,早年便对数学产生了兴趣,并对众多学科抱有强烈的好奇心——她曾描述自己小时候如饥似渴地阅读百科全书,内容涵盖从天文学到占星术的各个方面。她从很小就开始参加数学竞赛,她认为这段经历塑造了她工作中特有的「谦逊」:面对陡峭的天赋曲线,她内化了这样的信念——持续的努力和清晰的思考比先天优势更重要。

她在中国的大学获得了计算机科学学士学位(一份资料显示为北京航空航天大学,另一份为北京大学),随后在美国获得了计算机科学博士学位,研究方向涵盖强化学习、机器人学和网络科学。她在博士研究之后接触到了深度学习,这一发现点燃了她的好奇心,并最终引领她加入了OpenAI。


职业生涯

加入OpenAI前的行业经历

在加入OpenAI之前,Weng曾在硅谷多家公司担任数据科学家和软件工程师,包括Meta(当时还是Facebook)、Dropbox和Affirm。也有资料称她在Snapchat担任过研究科学家职务。这些在生产环境中构建机器学习系统的实际工程经验——在进入AI研究实验室之前——塑造了她对安全和对齐问题独特的应用导向视角:她始终将安全视为一个产品工程挑战,而非纯粹的理论问题。

OpenAI(2017年底/2018年–2024年)

机器人团队(2018–2021)
Weng在OpenAI的第一个角色是在机器人团队,从事该公司早期历史上一些最具挑战性的物理AI问题。旗舰项目是魔方灵巧操作系统——一个历时多年的项目,旨在通过强化学习训练一只机械手解决魔方难题,并于2019年公开展示。该项目利用领域随机化技术,在数百种模拟配置中进行训练,实现了向真实机器人的迁移。她曾描述硬件研究带来的情感冲击:「进行物理实验是一种极其激动人心、充满挑战且富有情感的经历。」这段机器人研究经历使她后续的安全工作建立在对强化学习失败模式、奖励篡改以及模拟与现实之间差距的亲身实践理解之上。

应用AI研究团队(2021–2023)
2021年,Weng转入OpenAI的应用AI研究团队,负责领导研究工作,将公司新兴的语言模型能力与下游应用联系起来。这一时期与ChatGPT和GPT-4的开发时期重合,要求她将研究级的模型行为理解与应用工程视角相结合,以在面向用户的场景中使系统可靠且安全地运行。

安全系统团队领导(2023–2024)
2023年,Weng受命领导OpenAI的安全系统团队——该团队鼎盛时期拥有超过80名科学家、研究人员和政策专家。团队的职责是防范前沿模型带来的风险,包括对抗性攻击、越狱、RLHF训练中的奖励篡改以及评估灾难性风险场景。她还担任了董事会安全与安保委员会的成员,这使她拥有正式的机构监督职责,负责OpenAI治理结构最高层级的安全决策。

研究与安全副总裁(2024年7月–11月)
在安全负责人Aleksander Madry离职后,Weng于2024年7月被任命为研究与安全副总裁,将OpenAI的安全研究统一到一个领导之下。她的职责包括管理现有安全系统,以及为未来模型扩展准备度评估。这一任命发生在OpenAI一系列安全相关人员离职的大背景下,其中包括Jan Leike、John Schulman和Mira Murati。

2024年11月15日,Weng在X上宣布离职:「在OpenAI工作了7年之后,我觉得是时候重新出发,探索一些新的东西了。我做出了离开OpenAI这个极其艰难的决定。回望我们所取得的成就,我为安全系统团队的每一位成员感到无比自豪,并且我对团队将继续蓬勃发展抱有极高的信心。」

Thinking Machines Lab — 联合创始人(2025年至今)

Weng是Thinking Machines Lab的联合创始人,该实验室由前OpenAI CTO Mira Murati于2025年初创立。创始团队包括John Schulman、Alec Radford、Barret Zoph,以及多位其他OpenAI前员工。Thinking Machines Lab将自己定位为专注于人机协作的AI研究和产品实验室。Weng在安全系统、应用AI研究和机器人学方面的背景与该实验室的议程直接契合。

Fellows Fund — 杰出研究员(2024年12月)

2024年12月,专注于AI的风险投资公司Fellows Fund宣布Weng担任杰出研究员。她表示:「Fellows Fund的使命和愿景非常引人注目。我很荣幸能够加入这个AI研究员团体,支持下一代AI创始人。」


Lil’Log (lilianweng.github.io)

Lil’Log是Weng的个人技术博客,自2017年开始运行。她在首页上直白地描述了其起源:「我从2017年开始在这个博客上记录我的学习笔记。」起初,这只是一个巩固自身理解的个人实践,却在随后的几年里,成为了ML研究和工程社区中链接和引用最多的资源之一——成为从业者在遇到新课题时的首选权威参考。

该博客的权威性建立在非凡的深度、教学清晰度和研究时效性的结合之上。博文通常需要20-45分钟阅读,系统地用正式符号覆盖相关文献,并随着领域的发展进行更新。它们既非纯粹的教程,也非纯粹的文献综述,而更接近于研究生对一个主题的理想解释——技术上严谨、自成一体,并且由真正的好奇心和对理解本身的追求所驱动,而非为了表演。

主要博文选编:

博文 日期 重要性
A (Long) Peek into Reinforcement Learning 2018年2月 全面的强化学习概述;被广泛用作课程参考
Meta-Learning: Learning to Learn in Few Steps 2018年11月 元学习的经典入门介绍
Domain Randomization for Sim-to-Real Transfer 2019年5月 对Weng机器人学研究背景的详细技术解释
What are Diffusion Models? 2021年7月 在Stable Diffusion之前就成为扩散模型的标准介绍;在2024年间持续更新
Contrastive Representation Learning 2021年5月 自监督学习的全面综述
How to Train Really Large Models on Many GPUs? 2021年9月 与Greg Brockman在OpenAI博客上合作发表了升级版
Large Transformer Model Inference Optimization 2023年1月 系统化了推理效率文献
Prompt Engineering 2023年3月 该领域阅读最广的介绍之一;将其定性为「经验科学」
LLM Powered Autonomous Agents 2023年6月 定义了规划/记忆/工具使用智能体框架,该框架后来主导了后续的智能体研究
Adversarial Attacks on LLMs 2023年10月 关于越狱和对抗鲁棒性的全面综述
Thinking about High-Quality Human Data 2024年2月 对标注质量、RLHF标记以及数据工作被低估的分析
Reward Hacking in Reinforcement Learning 2024年11月 她在OpenAI时期的最后一篇重要博文;综合了安全关键故障模式
Why We Think 2025年5月 对推理时计算和思维链的分析;感谢John Schulman「非常有价值的反馈和直接修改」

博文「LLM Powered Autonomous Agents」(2023年6月)是Weng引用最多的博客作品。它引入了一个连贯的框架——将LLM作为智能体的大脑,辅以规划、记忆和工具使用——这个框架成为了研究论文和产品开发中智能体系统设计的参考概念结构。该博文对领域如何描述和构建基于LLM的智能体的影响难以估量。


主要贡献

  • Lil’Log——历经七年、深入研究、教学意义非凡的ML博客文章,塑造了一代研究人员和工程师对该领域的理解;「What are Diffusion Models?」和「LLM Powered Autonomous Agents」是有史以来阅读最广的ML解释之一。
  • OpenAI安全系统——建立并领导了负责保护OpenAI前沿模型免受对抗性攻击、奖励篡改和灾难性风险的团队;她建立的外部红队项目和准备度评估将结构化安全评估制度化为前沿AI实验室的常规做法。
  • 魔方灵巧操作——OpenAI机器人项目的关键贡献者,该项目通过基于领域随机化的强化学习展示了灵巧的机械手操作;这是物理AI领域的一项里程碑式成果。
  • OpenAI应用AI研究——领导了OpenAI研究能力向应用系统的转化,为ChatGPT和GPT-4背后的评估和对齐基础设施的构建做出了贡献。
  • 安全政策与治理——担任OpenAI董事会安全与安保委员会成员;她将安全研究统一到单一副总裁职位下,代表了OpenAI在结构上对一体化安全监督的承诺。

奖项与认可

  • 《商业内幕》2024年AI权力榜单——因在安全和合乎道德的AI开发方面的领导力而入选。
  • Fellows Fund杰出研究员(2024年12月)。
  • Google Scholar引用超过48,000次——反映了她研究出版物以及Lil’Log间接学术影响力的覆盖范围。

关键关系

  • Mira Murati——Thinking Machines Lab联合创始人;她们共同创立公司反映了共同的信念:安全和研究基础设施与强大AI的开发密不可分。
  • John Schulman——Thinking Machines Lab联合创始人;Weng感谢他对「Why We Think」(2025)的直接修改;是她在强化学习和推理领域的长期智力合作者。
  • Aleksander Madry——Weng之前负责OpenAI安全准备工作的主管;在Madry于2024年7月被调任后,Weng接手了准备团队,随后晋升为副总裁。
  • Jan Leike——前OpenAI安全负责人,他的高调离职发生在Weng被任命之前;两人都是构成OpenAI 2024年情况的那波安全导向离职潮的一部分。
  • Greg Brockman——与Weng合作,为OpenAI博客撰写了她的博文「How to Train Really Large Models」的升级版;这是她融入OpenAI研究传播文化的一个信号。

个人风格

Weng的公众形象存在一个悖论:她是AI领域阅读最广的技术写作者之一,然而她的博客始终保持个人笔记而非权威论述的框架。这种谦逊是真诚的,也源于她的个人经历。她将其追溯到童年时期的数学竞赛,那时她早早遇到了自身天赋的局限性,学会了以渐进而非英雄主义的方式去解决难题。她将自己的核心特质描述为「坚持」和「谦逊」;朋友们则形容她「有条理」和「有耐心」。博客开头的免责声明——指出语法错误是表明ChatGPT未参与写作的证据——表明其写作是深思熟虑且以第一人称视角进行的,在一个AI辅助润色已成为常态的领域中,这一点尤为特别。她的安全理念与她的个人认识论相呼应:她曾表示「规模扩张并非唯一的配方」,而对齐和安全是「当前最紧迫的挑战」,这一立场并非来自外部的批评,而是源于多年从内部构建这些系统的经历。她的Digg vibe简介(主要话题:强化学习、AI安全、LLM对齐)反映了一位沟通者的公众身份在她的机构地位上升过程中始终保持技术根基。


参考资料