斯坦福大学计算机科学与电气工程系助理教授,模型无关元学习(MAML)的发明者,直接偏好优化(DPO)的合著者,Physical Intelligence 的联合创始人——机器学习和机器人学习领域引用率最高的早期职业研究员之一。
简介
| 领域 | 详情 |
|---|---|
| 出生 | 1992年10月8日,美国 |
| 国籍 | 美国 |
| 现任机构 | 斯坦福大学 (IRIS Lab);Physical Intelligence (联合创始人) |
| 研究方向 | 元学习、机器人学习、强化学习、模仿学习、视觉-语言-动作模型 |
| 博士导师 | Sergey Levine;Pieter Abbeel |
| 博士论文 | Learning to Learn with Gradients (UC Berkeley, 2018) |
| 学术网站 | ai.stanford.edu/~cbfinn |
| X / Twitter | @chelseabfinn |
| GitHub | @cbfinn |
| Google Scholar | scholar.google.com (126,000+ 引用) |
概览
Chelsea Finn 是一位美国计算机科学家,也是她这一代在机器学习和机器人学交叉领域最具影响力的研究者之一。她最著名的成就是发明了模型无关元学习(MAML),这是一种基于梯度的算法,发表于 ICML 2017,成为该十年引用率最高的论文之一,并确立了元学习作为一个主要研究方向。作为直接偏好优化(DPO,NeurIPS 2023)的合著者,她贡献了第二种极具影响力的技术,这次用于语言模型对齐,该技术迅速在学术界和工业界取代了基于 RLHF 的方法。Finn 在斯坦福大学领导 IRIS Lab(大规模机器人交互智能实验室),她在计算机科学和电气工程系担任联合职务,并被授予 William George and Ida Mary Hoover 教师研究员称号。2024年,她联合创立了 Physical Intelligence (Pi),这是一家机器人 AI 公司,融资 4 亿美元,估值 28 亿美元,致力于为物理机器人开发通用基础模型。她的 Google Scholar 引用量已超过 126,000 次——对于一位在 2018 年才完成博士学位的 researcher 来说,这是一个非凡的数字。
早年经历与教育
麻省理工学院 电气工程与计算机科学 理学学士
Finn 在麻省理工学院完成了她的 EECS 本科学位,为她在机器学习和控制系统方面奠定了技术基础,这也塑造了她后来的研究生研究方向。
加州大学伯克利分校 计算机科学 博士,2018年
Finn 加入了伯克利人工智能研究实验室 (BAIR),由 Sergey Levine 和 Pieter Abbeel 共同指导。她的论文《Learning to Learn with Gradients》发展了基于梯度的元学习的理论和算法框架——即可以通过优化模型参数,使其成为极佳的初始值,从而通过少量梯度步骤快速适应新任务。该论文获得了 ACM 博士论文奖,这是该领域对博士论文的最高认可。她也是加州大学伯克利分校 EECS 系 C.V. & Daulat Ramamoorthy 杰出研究奖(2016年)的首位女性得主,该奖项授予在博士研究期间做出卓越研究的学者。在攻读博士期间,她还在 Google Brain 实习,从事基于深度预测模型的大规模机器人学习研究。
职业生涯
加州大学伯克利分校 —— BAIR 实验室(2014–2018)
作为 Levine 和 Abbeel 指导下的博士生,Finn 发展了定义其早期声誉的方法:视觉运动策略的端到端学习、用于物理交互的视频预测,以及——最重要的——MAML 算法。在博士研究的同时,她还联合教授了一门关于深度强化学习的开创性课程(UC Berkeley CS294-112,2017年春季),在 NeurIPS 2016 联合组织了一场关于深度学习的行动与交互研讨会,并联合组织了 BAIR Camp,一个面向低收入家庭高中生的暑期拓展营。
Google Brain —— 实习(2016–2017)
在博士期间,Finn 作为研究实习生加入 Google Brain,参与了涉及大规模预测模型训练和机器人抓取数据集的机器人学习项目,其中一些数据集以 Google Brain Robotics Data 语料库的形式公开。
斯坦福大学 —— IRIS 实验室(2019–至今)
Finn 于 2019 年加入斯坦福大学担任助理教授。她在计算机科学和电气工程系担任联合职务,并隶属于斯坦福 HAI 和斯坦福 ML 小组。她的实验室 IRIS(大规模机器人交互智能)的研究围绕四个主题展开:从离线数据和演示中学习、元学习与泛化、视觉-语言-动作模型,以及现实世界的机器人部署。
CS330: 深度多任务与元学习 —— Finn 从 2019 年秋季开始设计并教授这门斯坦福课程;多个版本的讲座视频已公开,全球范围内被广泛用作研究生元学习的标准课程。
CS224R: 深度强化学习 —— Finn 还教授这门斯坦福课程,内容涵盖现代深度 RL 方法及其在机器人控制中的应用。
在斯坦福的关键研究方向:
在担任教职期间,Finn 的实验室为多个不同的研究方向做出了贡献。在元学习和泛化方面,关于分布外鲁棒性和分布偏移的研究(包括 WILDS 基准,ICML 2021)将其博士时期的贡献扩展到鲁棒机器学习的更广泛问题。在机器人学习方面,她的团队研究了用于机器人的离线与在线 RL、跨形态迁移(Bridge Data 系列)和类人机器人模仿(HumanPlus,2024)。最近,OpenVLA(2024)——一个与斯坦福和伯克利的合作者共同开发的开源视觉-语言-动作模型——为通用机器人控制设定了新的开放标准。在语言模型方面,DPO(2023)成为近年来对 LLM 对齐方法学最重要的贡献之一。
Physical Intelligence (Pi) —— 联合创始人(2024–至今)
2024 年,Finn 与 Sergey Levine、Karol Hausman、Brian Ichter、Lachy Groom、Adnan Esmail 和 Quan Vuong 共同创立了 Physical Intelligence。该公司的理念——即单个大型基础模型可以学习控制任何机器人完成任何任务,类似于大型语言模型在文本上的泛化——直接反映了 Finn 和 Levine 十年来发展的研究计划。Physical Intelligence 已融资 4 亿美元,估值 28 亿美元,投资方包括 Bezos Expeditions、Khosla Ventures 和 OpenAI Startup Fund。该公司的首个公开模型 π0 (pi-zero) 是一个视觉-语言-动作模型,展示了在多个机器人平台上通用的灵巧操作能力。
主要贡献
-
模型无关元学习(MAML) —— 发表于 ICML 2017 (Finn, Abbeel, Levine),MAML 引入了一种基于梯度的元学习算法,优化初始模型参数以在数据极少的情况下快速适应新任务。其模型无关的设计意味着它适用于任何基于梯度训练的模型——分类、回归或强化学习——并成为元学习文献中的奠基性论文之一,积累了数万次引用,并催生了数十种算法变体,包括 Reptile、FOMAML 和 iMAML。
-
端到端深度视觉运动策略 —— 发表于 JMLR 2016 (Levine, Finn, Darrell, Abbeel),该论文证明了深度神经网络可以从摄像头图像和关节角度端到端地学习机器人操作策略,将视觉感知和运动控制连接在一个单一的可微系统中。
-
直接偏好优化(DPO) —— 发表于 NeurIPS 2023 (Rafailov, Sharma, Mitchell, Ermon, Manning, Finn),DPO 将 RLHF 偏好学习目标重新表述为监督二进制分类问题,消除了对单独奖励模型的需求以及基于 PPO 的微调的不稳定性。它几乎立即被研究界和工业界采用,并以近年 NeurIPS 历史上最快的速度之一积累引用。Finn 作为资深合著者,提供了实验室基础设施和研究方向。
-
CS330: 深度多任务与元学习 —— 由 Finn 于 2019 年创建的这门斯坦福研究生课程成为全球元学习和多任务学习的主要大学课程;其公开的讲座视频已惠及远超斯坦福范围的从业者和研究人员。
-
OpenVLA: 开源视觉-语言-动作模型 —— 发表于 CoRL 2024 (Kim, Pertsch, Karamcheti et al., 由 Finn 与合作者共同指导),OpenVLA 建立了一个免费可用的、可复现的通用机器人控制基线,使更广泛的社区能够进行 VLA 研究。
-
Open X-Embodiment 和 RT-X —— Finn 是一个大型合作团队(ICRA 2024)的成员,该团队组装了跨越 22 种机器人形态和 527 种技能的 Open X-Embodiment 数据集,实现了跨形态迁移学习并将其公开;这是迈向可泛化机器人基础模型的一个里程碑式步骤。
-
HumanPlus: 人形机器人示教与模仿 —— 发表于 CoRL 2024 (Fu, Zhao, Wu, Wetzstein, Finn),该工作展示了通过模仿学习和强化学习的结合,从人体运动捕捉中学习全身人形机器人操作。
-
WILDS 基准 —— 合著 (Koh et al., ICML 2021),WILDS 提供了跨十个真实世界数据集的机器学习分布偏移的严格基准,为评估抵御部署偏移的鲁棒性建立了标准。
-
物理交互的视频预测 —— 发表于 NeurIPS 2016 (Finn, Goodfellow, Levine),该工作证明了神经网络可以从原始视频中学习物理场景的前向模型,从而实现机器人交互动力学的无监督学习。
奖项与荣誉
- 总统早期职业科学家和工程师奖(PECASE) (2025) —— 美国政府授予早期职业科学家和工程师的最高荣誉。
- Alfred P. Sloan 研究奖学金 (2023) —— 授予杰出的早期职业教师。
- IEEE RAS 机器人与自动化早期学术职业奖 (2022)
- 海军研究局青年研究员奖 (2021)
- 微软研究院教师奖学金 (2020)
- 三星年度AI研究员 (2020) —— 授予全球 19 位早期职业 AI 研究员。
- Intel 新星教师奖 (2020) —— 授予 7 位美国信息与通信领域的教师。
- ACM 博士论文奖 (2019) —— ACM 对计算领域博士论文的最高认可;授予论文《Learning to Learn with Gradients》。
- MIT Technology Review 35岁以下创新者 —— 先锋 (2018)
- 加州大学伯克利分校 EECS 系 C.V. & Daulat Ramamoorthy 杰出研究奖 (2016) —— 首位获得该奖项的女性。
主要合作关系
- Sergey Levine —— 伯克利博士联合导师;Physical Intelligence 联合创始人;Finn 与 Levine 长达十年的合作涵盖视觉运动策略学习、离线 RL、跨形态迁移以及 Pi 的创立;是机器人学习领域最高产的研究伙伴关系之一。
- Pieter Abbeel —— 伯克利博士联合导师;MAML 与 Abbeel 合著;其实验室对元学习和机器人操作的关注塑造了 Finn 的基础贡献;也是早期视觉运动策略工作的合著者。
- Rafael Rafailov —— 斯坦福博士生,Finn 共同指导其博士论文工作;DPO 的第一作者,DPO 是 2023 年最具影响力的对齐论文之一。
- 李飞飞 —— 斯坦福资深同事,HAI 的教师成员;出现在 Finn 最突出的学术追随者和专业网络中;她们在斯坦福的实验室在机器人感知和学习方面有重叠。
- Karol Hausman —— Physical Intelligence 联合创始人;前 Google Brain 研究员,其在 RT-2 和大规模机器人学习方面的工作与 Finn 的计划直接吻合。
- Tony Z. Zhao —— 博士生,是来自 Finn 更广泛斯坦福网络的 ALOHA/Unleashed 和移动操作工作的关键贡献者。
- Ian Goodfellow —— 2016 年 NeurIPS 视频预测论文的合著者;早期合作者,出现在 Finn 最突出的专业联系中。
- Christopher Manning —— 斯坦福同事,DPO 的合著者;这次合作体现了 Finn 在斯坦福机器人学和自然语言处理之间的跨学科参与。
个人风格
Finn 的研究特点是非常偏爱简单、通用的算法,而非针对特定领域设计的算法——这种敏感性直接产生了 MAML 的模型无关设计和 DPO 将 RLHF 重新表述为监督分类。她的实验室将研究框架定义为“大规模机器人交互智能”,反映出一种信念:与物理世界的具身交互既是对通用智能的关键测试,也是其关键驱动力。在课程设计和拓展方面,她投入了大量精力使研究生级别的研究方法广泛可及——既通过公开的斯坦福讲座系列,也通过伯克利注重多样性的教育项目。她的公共沟通在技术上精确且显著低调;她倾向于根据新结果的失败模式和剩余未解决问题来框架化,而不是使用最高级表述。
参考资料
- Wikipedia — Chelsea Finn
- 个人学术网站 — ai.stanford.edu/~cbfinn
- Stanford Profiles
- IRIS Lab — irislab.stanford.edu
- X / Twitter — @chelseabfinn
- GitHub — @cbfinn
- Digg profile
- Google Scholar
- Wikipedia — Physical Intelligence Inc.
- MAML paper — arXiv:1703.03400
- DPO paper — arXiv:2305.18290
- MIT Technology Review — Pioneers: Chelsea Finn (2018)
- Berkeley Engineering profile (2018)