Quanquan Gu

ref · 2026 年6 月 2 日 12:47

机器学习理论家与 AI 研究负责人，同时推进了 AI for Science 前沿的蛋白质结构预测，并共同领导了字节跳动 Seed 的 LLM 预训练与规模化工作。


出生	约 1984 年，中国
国籍	美国华人
现任机构	加州大学洛杉矶分校计算机科学系（终身副教授，休假中）；字节跳动研究（研究科学家，2023年7月–2026年6月，已离职）
研究方向	非凸优化、深度学习理论、强化学习、大语言模型、AI for Science（蛋白质设计与结构预测）、扩散模型
博士导师	Jiawei Han
博士论文	大型网络的在线与主动学习：理论与算法（伊利诺伊大学厄巴纳-香槟分校，2014年）
网站	web.cs.ucla.edu/~qgu
X / Twitter	@QuanquanGu
Google Scholar	Quanquan Gu

概述

Quanquan Gu 是一位美籍华人机器学习研究员，加州大学洛杉矶分校（UCLA）计算机科学系终身副教授，以在深度学习、非凸优化和强化学习领域的严谨理论贡献而闻名。2023年7月至2026年6月，他在字节跳动 Seed 兼任研究科学家，领导了两个截然不同的研究方向：首先构建了业界最具竞争力的 AI for 蛋白质科学体系之一，随后转向共同创立 LLM 优化与规模化团队，该团队为 Seed 2.0 的开发奠定了基础。他对机器学习理论、生物 AI 和大规模预训练（这些领域在单一研究者身上鲜有重叠）的同步掌握，持续引起了学术界和工业界的关注。他于2026年6月离开字节跳动，署名时写道「最好的模型尚未到来。规模化继续」，未透露下一站目的地。

早期生活与教育

顾（Gu）在清华大学完成了本科学习，获得自动化工程学士学位（2003–2007），随后在同校获得控制科学与工程硕士学位（2007–2010）。之后他前往美国，在伊利诺伊大学厄巴纳-香槟分校（UIUC）攻读博士学位，师从数据挖掘与知识发现领域被引次数最多的研究者之一 Jiawei Han。其博士论文《大型网络的在线与主动学习：理论与算法》解决了从大规模、快速演化的信息网络中高效学习的挑战，结合了在线学习算法与主动学习策略。他于2014年获得博士学位，在博士学习期间获得了 UIUC 计算机科学系奖学金（2010）和 IBM 博士奖学金（2013–2014）。毕业后，他在普林斯顿大学运筹学与金融工程系担任博士后研究员（2014–2015）。

职业生涯

弗吉尼亚大学（2015–2018）

顾（Gu）加入弗吉尼亚大学（UVa）担任助理教授（tenure-track），最初在系统与信息工程系（2015–2017），随后于2016年至2018年离任期间在计算机科学系兼任职务。在此期间，他确立了自己在非凸优化和深度学习理论基础方面的研究方向，发表了关于随机方差缩减方法和过参数化模型统计学习理论的早期工作。在 UVa 期间，他获得了 NSF 职业奖（2017）和 UVa SEAS 研究创新奖（2017），并获得了多项关于隐私和高维数据机器学习的 NSF 资助。

加州大学洛杉矶分校计算机科学系（2018年至今）

顾（Gu）于2018年7月加入 UCLA 担任助理教授（tenure-track），2022年7月晋升为终身副教授，领导 UCLA 通用人工智能实验室。他的研究团队在四个相互关联的领域产出了大量成果。

在优化与深度学习理论方面，实验室推导了过参数化网络中随机梯度下降（SGD）的尖锐泛化界，描述了两层卷积神经网络中良性过拟合的特征（NeurIPS 2022, 口头报告），并通过一系列论文分析了 SGD 的隐式正则化。MARS 优化器（ICML 2025）引入了一种用于训练大型模型的新型方差缩减框架，而张量积注意力（Tensor Product Attention, NeurIPS 2025, Spotlight）提出了一种新的注意力机制架构。

在强化学习方面，该团队建立了线性马尔可夫决策过程（MDP）和线性混合 MDP 的近最小最大最优样本复杂度结果（COLT 2021, ICML 2021, ICML 2023），为具有函数逼近的可证明高效的强化学习（RL）提供了严谨理论。

在语言模型对齐与微调方面，顾（Gu）共同开发了自博弈微调（SPIN, ICML 2024），这是一种使语言模型能够通过与自身先前迭代输出进行对抗来迭代改进的方法，无需额外人工标注，并将该框架扩展至用于文本到图像生成的扩散模型（NeurIPS 2024）。自博弈偏好优化（SPPO, ICLR 2025）将其完善为一种原则性的对齐方法。

在 AI for Science 方面，基于 UCLA 的基于结构的药物设计工作（DecompDiff, ICLR 2024; DecompOpt, ICLR 2024）和蛋白质构象建模（ICML 2024）直接预示并指导了顾（Gu）随后在字节跳动领导的工业级生物学研究。

在 COVID-19 疫情期间（2020–2021），他的团队开发了 UCLA SuEIR 流行病学模型，该模型被美国疾病控制与预防中心（CDC）用于每周预测累计死亡和住院人数，结果发表在《PNAS》（2022, 2023）。

顾（Gu）还在西蒙斯计算理论研究所担任了两次长期研究职务：作为伯克利深度学习基础暑期项目的研究员（2019年5月–8月），以及作为强化学习理论项目的长期参与者（2020年8月–12月）。此外，他还在普林斯顿高等研究院的优化、统计与理论机器学习特别年度期间担任短期访问学者（2019年10月–11月）。

字节跳动研究（2023年7月–2026年6月）

顾（Gu）于2023年7月加入字节跳动研究，领导公司的 AI for 药物发现计划，同时保留 UCLA 教职并休假。在大约18个月的时间里，他的团队在计算生物学领域产出了三项主要成果。

SeedFold（arXiv: 2512.24354, 2025年12月）是一个生物分子结构预测系统，沿三个维度扩展了 AlphaFold 3 架构：模型宽度、通过线性三角注意力的架构效率，以及通过大规模蒸馏至2650万个训练样本的数据量。在 FoldBench 上基准测试，SeedFold 在大多数蛋白质相关任务上超越了 AlphaFold 3，包括单体预测、蛋白质-蛋白质对接、抗体-抗原复合物和蛋白质-配体结合。

SeedProteo（arXiv: 2512.24192, 2026年2月）是一个基于扩散的从头全原子蛋白质结合剂设计系统，将 SeedFold 折叠架构重新用作生成框架，集成了自条件特征以指导设计过程。在无条件生成方面，它可处理长达1000个残基的序列，在结合剂设计基准测试中超越了 AlphaProteo、RFDiffusion、Chai-2、BinderCraft 和 BoltzGen。针对 PD-L1 和 SC2RBD 靶标的体外验证确认了经实验表达和结合的结合剂。

DPLM / DPLM-2 是一个扩散蛋白质语言模型系列（ICML 2024; ICLR 2025; 扩展于 ICML 2025），将蛋白质表示学习、无条件生成以及任意到任意条件生成（包括折叠、逆折叠和基序脚手架）统一到单一离散扩散预训练目标下。DPLM-2 将框架扩展为在单一预训练骨干网络中联合建模序列和 3D 结构。

2025年初，在 DeepSeek 的高调发布催化了中国 LLM 竞争加剧之后，顾（Gu）转向加入字节跳动的前沿模型工作，在 Seed 预训练组内创立了 LLM 优化与规模化团队。该团队从零开始构建了一个可扩展的预训练栈，并直接促成了 Seed 2.0（字节跳动的旗舰前沿模型）在顾（Gu）离职前约四个月的开发和发布。集成了 Seed 2.0 能力的字节跳动 AI 助手豆包，到2026年中期已拥有约3.36亿月活跃用户。

顾（Gu）于2026年6月3日宣布离开字节跳动 Seed，感谢同事们「一段无比充实的旅程」，未透露下一步动向。

主要贡献

SeedFold — 首个在广泛的 FoldBench 任务上超越 AlphaFold 3 的工业部署生物分子结构预测系统，结合了架构缩放、线性注意力和大规模数据蒸馏（2650万个样本）。
SeedProteo — 最先进的从头全原子蛋白质结合剂设计模型，在硅片基准测试中超越所有主要开源竞争对手，并经过实验体外验证；已在 seedfold.io 上公开部署。
DPLM 系列 — 扩散蛋白质语言模型系列（ICML 2024, ICLR 2025），统一了表示学习和条件/无条件生成；DPLM-2 在单一预训练骨干网络中联合建模序列和 3D 结构。
Seed 2.0 预训练栈 — 共同领导了 LLM 优化与规模化团队，构建了字节跳动可扩展的前沿预训练基础设施，直接驱动了 Seed 2.0 及后续模型。
自博弈微调（SPIN） — 一种语言模型自我改进框架（ICML 2024），无需额外人工标注即可实现迭代改进；已扩展至扩散模型（NeurIPS 2024）和偏好优化（SPPO, ICLR 2025）。
良性过拟合理论 — 一系列论文描述了由 SGD 训练的过参数化神经网络在插值训练数据时进行泛化的条件（NeurIPS 2022 口头报告; COLT 2021; JMLR 2024），为现代深度学习中广泛存在的经验现象提供了严谨依据。
可证明高效的强化学习 — 建立了线性 MDP 和线性混合 MDP 的近最小最大最优样本复杂度界（COLT 2021, ICML 2021, ICML 2023），将 RL 算法置于严谨的理论基础之上。
UCLA SuEIR 模型 — COVID-19 流行病学模型，被 CDC 用于全国死亡和住院预测（2020–2021），结果贡献了两篇 PNAS 出版物（2022, 2023）。
EurekaClaw — 一个本地优先的 AI 研究智能体（eurekaclaw.ai），自动化从构思到证明、实验和论文生成的流程，体现了顾（Gu）关于 AI 增强科学发现的更广泛愿景。

奖项与荣誉

WSDM 时间检验论文奖（2024） — 表彰早期信息网络与学习研究的长期影响。
阿尔弗雷德·P·斯隆研究奖学金（2022） — 由阿尔弗雷德·P·斯隆基金会颁发，表彰在机器学习和 AI 领域的杰出早期职业贡献。
摩根大通教师研究奖（2022） — 企业认可的应用 ML 研究影响力。
AWS 机器学习研究奖（2020） — 亚马逊网络服务对机器学习研究贡献的认可。
IJCAI 早期职业生涯演讲（2020） — 被选中在国际人工智能联合会议（IJCAI）上发表早期职业特邀演讲。
西蒙斯伯克利研究奖学金（2019） — 西蒙斯计算理论研究所深度学习基础暑期项目奖学金。
Adobe 数据科学研究奖（2018） 和 Salesforce 深度学习研究奖（2018） — 同年获得双份行业认可。
NSF 职业奖（2017） — 美国国家科学基金会的主要早期职业奖项，支持其非凸统计优化研究计划。
UVa SEAS 研究创新奖（2017） — 弗吉尼亚大学工程学院对研究创新的认可。
雅虎学术职业提升奖（2015） — 在其教职生涯起步时颁发。
IBM 博士奖学金（2013–2014） — 极具竞争力的 IBM 奖学金，支持博士研究。
清华大学优秀硕士论文奖（2010） — 院系对优秀硕士论文工作的认可。
UIUC 计算机科学系奖学金（2010） — 支持进入 UIUC 博士项目的奖学金。

关键关系

Jiawei Han — UIUC 博士导师；数据挖掘领域最具影响力的人物之一，其在网络知识发现方面的工作直接塑造了顾（Gu）的论文和早期研究方向。
Zaixiang Zheng — 字节跳动 Seed 的主要合作者；DPLM、DPLM-2、SeedProteo 及相关蛋白质建模系统的项目负责人。
Xinyou Wang — DPLM 和 DPLM-2 论文（ICML 2024, ICLR 2025）的关键合著者，在构建蛋白质语言模型系列中发挥了核心作用。
Huizhuo Yuan — 在 UCLA（MARS 优化器、SPPO）和字节跳动工作中频繁合著者；顾（Gu）在 LLM 与优化研究方向上的关键人物。
Dongruo Zhou — 强化学习理论（多篇 ICML 和 NeurIPS 论文）和非凸优化领域的高产合著者；现为独立研究者。
Difan Zou — 一系列有影响力论文的合著者，分析了过参数化模型中的 SGD 隐式正则化和良性过拟合。
Zixiang Chen — 深度学习理论及自博弈微调工作系列（SPIN, ICML 2024）的合著者。

个人风格

顾（Gu）在机器学习研究者中与众不同，他在学术界持续进行高产出、严谨的理论工作的同时，还在工业 AI 前沿推动应用工程——这种运作模式通常需要做出权衡，而他似乎一直抵制这种权衡。他在两种环境下的研究风格都以偏好最小最大最优的统计保证而非启发式性能改进为特征，即使在有实际动机的场景中也是如此。在公共场合，他一直是 AI 不仅是研究工具，而是正在积极重构研究流程本身这一观点的直言不讳的倡导者——他的 EurekaClaw 项目和在 X 上的评论反映了一种信念，即人类、模型和工具共同进化的「系统级发现」已经正在进行。他以「最好的模型尚未到来。规模化继续」这句简洁的告别语离开字节跳动，被广泛解读为一种意图声明而非回顾。

参考资料

个人网站：web.cs.ucla.edu/~qgu
UCLA Samueli 工程学院教师页面：samueli.ucla.edu/people/quanquan-gu
UCLA 通用人工智能实验室：uclaml.org
简历（PDF）：web.cs.ucla.edu/~qgu/pdf/CV.pdf
Google Scholar：scholar.google.com/citations?user=GU9HgNAAAAAJ
OpenReview 职业记录：openreview.net/profile?id=~Quanquan_Gu1
UIUC IDEALS 论文记录：ideals.illinois.edu/items/50868
SeedFold 项目页面：seedfold.github.io
DPLM GitHub 仓库：github.com/bytedance/dplm
南华早报离职报道（2026年6月2日）：scmp.com/tech/big-tech/article/3355677