美国计算机科学家、谷歌高级研究员(Senior Fellow);谷歌分布式系统基础设施与机器学习平台的首席架构师,现任谷歌深度思维(Google DeepMind)首席科学家。
基本信息/简介
| 字段 | 详情 |
|---|---|
| 全名 | 杰弗里·阿德盖特·迪恩(Jeffrey Adgate Dean) |
| 出生 | 1968年7月23日,美国夏威夷州火奴鲁鲁 |
| 国籍 | 美国 |
| 现任机构 | 谷歌深度思维(Google DeepMind) |
| 现任职务 | 首席科学家(Chief Scientist) |
| 研究领域 | 分布式系统、大规模机器学习、深度学习、计算机系统、机器学习在医疗健康领域的应用 |
| 博士导师 | 克雷格·钱伯斯(Craig Chambers) |
| 博士论文 | 面向对象语言的全局程序优化(华盛顿大学,1996年) |
| 谷歌研究页面 | research.google/people/jeff |
| X / Twitter | @JeffDean |
| 谷歌学术 | scholar.google.com/citations?user=NMS69lQAAAAJ |
概述
杰弗里·迪恩是一位美国计算机科学家。他于1999年中旬加入谷歌,是公司的第30号员工,并在随后的四分之一个世纪里塑造了现代互联网的基础设施。他与长期合作伙伴桑杰·格玛沃特(Sanjay Ghemawat)共同设计并构建了基础性的分布式系统——MapReduce、Bigtable、Spanner和Protocol Buffers——这些系统定义了大尺度数据处理的架构,并催生了包括Apache Hadoop在内的一代开源项目。从2011年起,他的研究重心转向机器学习,共同创立了谷歌大脑(Google Brain),并领导了其三代机器学习训练基础设施——DistBelief、TensorFlow和Pathways——的开发。此外,他还指导了word2vec、知识蒸馏(knowledge distillation)和稀疏专家混合(Sparse Mixture-of-Experts)架构等具影响力的研究。迪恩和格玛沃特是谷歌仅有的两位获得“高级研究员”(Senior Fellow)称号的个人,这是公司最高的技术荣誉。自2023年谷歌大脑与深度思维(DeepMind)合并为谷歌深度思维(Google DeepMind)以来,他担任首席科学家,同时致力于研究及产品中的人工智能相关项目。
早年生活与教育
童年与频繁迁徙的背景
迪恩于1968年7月23日出生在夏威夷州火奴鲁鲁。他的父亲是热带疾病研究员,母亲是一名医学人类学家;因工作关系,他的童年家庭频繁搬迁,曾居住于夏威夷、菲律宾、乌干达、索马里、瑞士以及美国的多个城市。从五年级到十年级,他在明尼阿波利斯-圣保罗地区上学,后来也回到该地区接受本科教育。在高中及大学暑假期间,他编写了一款名为Epi Info的流行病学软件——最初为美国疾病控制与预防中心(Centers for Disease Control)开发,后来也供世界卫生组织(World Health Organization)使用——这个项目至今仍是他被引用最多的作品之一。
明尼苏达大学(1986–1990)
1990年,迪恩以最高荣誉(summa cum laude)从明尼苏达大学获得计算机科学与经济学双学士学位。他的荣誉论文由维平·库马尔(Vipin Kumar)指导,探讨了神经网络训练的并行实现——这为他日后职业生涯的发展方向埋下了早期的伏笔。他在大一期间认识了后来的妻子海迪·霍珀(Heidi Hopper);两人均于1990年毕业。
世界卫生组织(1990–1991)
在本科与博士研究之间,迪恩在世界卫生组织日内瓦总部全球艾滋病项目工作了一年,开发用于HIV/AIDS大流行的统计建模与预测软件,并对他在高中时期开始编写的Epi Info代码库进行了扩展。
华盛顿大学博士研究(1991–1996)
1996年,迪恩在华盛顿大学获得计算机科学博士学位,导师是克雷格·钱伯斯。他的学位论文针对面向对象语言的编译器优化问题——具体来说,是针对Cecil和C++等语言的全程序分析与选择性专业化技术。这项研究获得了PLDI 2005颁发的十年回顾最具影响力论文奖(Most Influential Paper Award),其相关的性能分析研究还获得了SOSP 1997的最佳论文奖(Best Paper)。
职业生涯
数字设备公司/康柏西方研究实验室(1996–1999)
毕业后,迪恩加入位于帕洛阿尔托的DEC西方研究实验室。在那里,他致力于低开销性能分析工具、用于乱序执行处理器的微架构以及基于Web的信息检索研究。这项工作的大部分是在与桑杰·格玛沃特的密切合作下完成的,这标志着这段决定两人职业生涯的专业伙伴关系就此开始。康柏收购DEC后,迪恩于1999年初短暂加入比价购物初创公司mySimon,为其设计分布式网页抓取与索引系统,之后在同年晚些时候离开并加入谷歌。
谷歌——从基础架构工程师到高级研究员(1999–2011)
迪恩于1999年中旬加入谷歌,是公司的第30号员工。在接下来的十二年里,他与格玛沃特重新设计了谷歌工程的核心,交付了一系列能够支撑公司文档量、查询负载和更新频率呈数量级增长的可扩展系统。他们的主要贡献包括内部分布式计算栈——MapReduce(OSDI 2004)、Bigtable(OSDI 2006)、Spanner(OSDI 2012)、LevelDB(2011)和Protocol Buffers——以及五代连续的网页爬取、索引和查询服务系统。他还主导了初始版谷歌广告投放系统的设计与实现,并为谷歌翻译(Google Translate)的统计机器翻译后端做出了贡献。迪恩和格玛沃特被共同任命为谷歌高级研究员——这是公司的最高技术级别——截至2025年,这一荣誉仍只属于他们两人。
谷歌大脑——联合创始人及主管(2011–2018)
2011年,迪恩加入新成立的谷歌X实验室,着手研究深度神经网络。一个早期实验(后来被称为“猫神经元论文”)使用无监督学习方法,对上百万帧YouTube视频进行训练,产生了一个自发发展出人脸检测神经元的网络——这证明了无需人工标注数据的大规模深度学习能够浮现出有意义的表征。这个项目成为了谷歌大脑的种子,迪恩于2012年共同创立并开始领导该团队。在他的指导下,该团队开发了名为DistBelief的专有分布式训练系统,用于深度信念网络,能够扩展到包含20亿个参数的模型——而当时已发表的最先进模型通常只有1000万到5000万个参数。DistBelief随后被重构为TensorFlow,迪恩力主将其开源;TensorFlow于2015年11月发布,随后几年成为最广泛采用的深度学习框架。这一时期的谷歌大脑研究还产出了word2vec(NeurIPS 2013)、知识蒸馏(2015)、专家混合层(Mixture-of-Experts layer, ICLR 2017)以及谷歌的神经机器翻译系统(2016)。
谷歌AI——负责人(2018–2023)
2018年4月,在约翰·詹南德雷亚(John Giannandrea)离职加入苹果后,迪恩被任命为谷歌AI部门负责人,负责管理谷歌大脑、谷歌研究院(Google Research)及其与深度思维和产品团队的关系。在此职位上,他指导了Transformer架构、BERT、TPU硬件、PaLM和Pathways机器学习基础设施系统等方面的工作,同时共同撰写了涵盖芯片设计、医疗健康和气候等领域机器学习应用的研究论文。这一时期也发生了AI伦理研究员蒂姆尼特·格布鲁(Timnit Gebru, 2020年12月)和玛格丽特·米切尔(Margaret Mitchell, 2021年2月)的高调离职事件,这些事件引起了大量媒体关注。迪恩为此发布内部沟通,承认在处理异议研究方面存在失误。
谷歌深度思维——首席科学家(2023年至今)
2023年4月,Alphabet宣布将谷歌大脑与深度思维合并为一个独立部门——谷歌深度思维,由德米斯·哈萨比斯(Demis Hassabis)领导。作为此次重组的一部分,迪恩成为谷歌首席科学家,专注于谷歌深度思维和谷歌研究院的人工智能发展。他为谷歌多模态旗舰模型系列取名为“双子座”(Gemini),意为“如双胞胎般融合”。2025年,他加入Laude Institute董事会,这是一个致力于加速大学实验室人工智能研究成果转化的非营利组织。他继续发表论文,并经常就系统和机器学习研究方向发表主旨演讲。他亦是AI初创公司的活跃天使投资人,投资对象包括Perplexity、Sakana AI、Roboflow和World Labs等。
主要贡献
- MapReduce(OSDI 2004,与桑杰·格玛沃特合著)——提出了一种在商品化集群上处理和生成大规模数据集的编程模型,抽象了故障处理和分区逻辑;直接启发了Apache Hadoop,并改变了整个行业的大规模数据处理方式。获SIGOPS名人堂奖(2015年)。
- Bigtable(OSDI 2006,与格玛沃特、费伊·张、迈克·伯罗斯等合著)——设计了一个PB级半结构化存储系统,峰值每秒处理超过60亿次请求,管理着超过10EB的数据;影响了NoSQL运动,并作为云Bigtable(Cloud Bigtable)对外提供服务。获SIGOPS名人堂奖(2016年)。
- Spanner(OSDI 2012,与格玛沃特等合著)——一个全球分布式关系数据库,通过Paxos算法和跨地理数据中心的精确时钟提供强一致性;获OSDI 2012最佳论文奖、SIGOPS名人堂奖(2022年)和2025年ACM SIGMOD系统奖。
- Protocol Buffers——共同设计了一种与语言无关的二进制序列化格式,用于谷歌几乎所有的RPC协议;已开源并在谷歌外部被广泛采用。
- LevelDB(2011年,与格玛沃特合著)——一个开源键值存储库,源自Bigtable的SSTable设计,嵌入在Google Chrome的IndexedDB、Bitcoin Core和Minecraft Bedrock Edition中。
- DistBelief——设计并构建了一个专有的分布式训练系统,支持包含20亿个参数的模型,比当时已发表的工作大几个数量级;是TensorFlow的直接前身。
- TensorFlow(2015年,已开源)——共同设计并推动开源了谷歌的机器学习框架;被数百万研究人员和开发者使用,支持从嵌入式设备到TPU超级计算机的多种平台。
- Pathways(MLSys 2022)——共同设计了一种异步分布式数据流系统,支持大规模异构、多任务、稀疏神经网络的训练;是PaLM和Gemini的基础架构。
- word2vec(NeurIPS 2013,与托马斯·米科洛夫等合著)——共同撰写了介绍分布式词表示的论文,这些表示已成为NLP的基石;获NeurIPS 2023时间检验奖(Test of Time Award)。
- 知识蒸馏(2015年,与杰弗里·辛顿和奥里奥尔·维尼亚尔斯合著)——共同创建了将知识从大型教师网络迁移到较小学生模型的技术,现已普遍用于模型压缩和部署流程。
- 专家混合层(ICLR 2017)——共同撰写了稀疏门控MoE论文,该论文是现代大规模稀疏架构(包括当前前沿模型所使用的)的基础。
- “大规模下的长尾”(《ACM通讯》,2013年,与路易斯·安德烈·巴罗索合著)——分析了大规模服务中的延迟可变性,并提出了应对长尾延迟的技术;获SIGOPS名人堂奖(2025年)。
- TPU架构倡导——早期认识到生产环境中的大规模深度学习需要定制化硅片;倡导并推动了谷歌从TPUv1开始的张量处理单元项目,在推理方面实现了比同期CPU/GPU高出30至80倍的每瓦性能。
- “伟大的AI觉醒”贡献——关于神经机器翻译的工作在2016年《纽约时报杂志》的专题报道中被覆盖,使大众了解到谷歌翻译转向神经方法的规模。
奖项与荣誉
- ACM计算奖(2012年,与桑杰·格玛沃特共同获得)——表彰其为可扩展分布式系统做出的基础性贡献。
- ACM SIGOPS马克·韦泽奖(2012年)——表彰其对操作系统研究的贡献。
- 美国计算机协会会士(2009年)
- 美国国家工程院院士(2009年)——美国工程学界的最高荣誉之一。
- 美国艺术与科学院院士(2016年)
- 美国科学促进会会士(年份未注明)
- IEEE约翰·冯·诺伊曼奖章(2021年)——IEEE在计算机科学与工程领域的最高荣誉。
- NeurIPS时间检验奖(2023年)——因word2vec论文《词和短语的分布式表示及其组合性》(NeurIPS 2013)获得。
- SIGOPS名人堂奖——因MapReduce(2015年)、Bigtable(2016年)、Spanner(2022年)和《大规模下的长尾》(2025年)获得。
- ACM SIGMOD系统奖(2025年)——因Spanner获得。
- TIME100 AI(2025年)——入选《时代》杂志“全球最具影响力的100位AI人物”榜单。
主要合作关系
- 桑杰·格玛沃特(Sanjay Ghemawat)——长达数十年的工程合作伙伴;两人共同撰写了MapReduce、Bigtable、Spanner、LevelDB和Protocol Buffers,也是仅有的两位谷歌高级研究员。《纽约客》在2018年以《成就谷歌庞大的友谊》为题报道了他们的合作。
- 克雷格·钱伯斯(Craig Chambers)——华盛顿大学博士导师,指导了迪恩面向对象语言编译器优化的研究。
- 维平·库马尔(Vipin Kumar)——明尼苏达大学本科荣誉论文导师,指导了迪恩早期的神经网络训练工作。
- 杰弗里·辛顿(Geoffrey Hinton)——知识蒸馏论文(2015年)的合著者;辛顿在深度信念网络方面的工作是谷歌大脑形成的直接学术前驱。
- 德米斯·哈萨比斯(Demis Hassabis)——谷歌深度思维CEO,在2023年谷歌大脑与深度思维合并中的对应角色;两人现共同领导统一的组织。
- 蒂姆尼特·格布鲁(Timnit Gebru)——前谷歌伦理AI团队联合负责人,其于2020年12月被解雇引发了重大的内部和公众争议,并使迪恩的领导决策受到质疑。
- 黎越荣(Quoc V. Le)——谷歌大脑的长期合作者;在猫神经元论文、word2vec和神经机器翻译工作中发挥了关键作用。
- 大卫·帕特森(David Patterson)——计算机架构先驱,在TPU和机器学习碳排放方面的工作方面有合作;与迪恩共同服务于Laude Institute董事会。
个人风格
在业界,迪恩以其异常广泛的技术范围而著称——他能游刃有余地涉猎编译器理论、分布式系统和深度学习研究,职业生涯跨越四十年——同时他始终倾向于构建在可行规模最前沿运行的系统。他的技术写作和演讲偏好量化框架:他以其发表具体的吞吐量、延迟和碳排放数据而非定性评估而闻名,并曾公开挑战他认为是关于机器学习环境成本的错误信息。除了研究成就外,他还是一个网络迷因——“杰弗里·迪恩轶事”(Jeff Dean Facts)——的素材来源,这是一种查克·诺里斯(Chuck Norris)式对其编程能力的夸张陈述——这反映了工程师群体中对他能够解决他人认为棘手问题的真实声誉。从他的个人网站和演讲中,可以窥见他那异常频繁迁徙的童年背景,他部分将此归因于自己能够自如地在不同学科和地域间工作的能力。
参考文献
- 维基百科:杰弗里·迪恩
- 谷歌研究页面
- 谷歌学术页面
- X / Twitter:@JeffDean
- Digg AI页面
- HAI斯坦福页面
- TIME100 AI 2025:杰弗里·迪恩
- 詹姆斯·萨默斯(James Somers),《成就谷歌庞大的友谊》,《纽约客》,2018年12月10日
- 明尼苏达大学科学与工程学院,《杰弗里·迪恩:谷歌的无名英雄》,2013年
- 汤姆·西蒙奈特(Tom Simonite),《谷歌新任AI负责人聪明到不需要AI》,《连线》,2018年4月