Yann LeCun

ref · 2026 年5 月 25 日 02:49

法裔美国计算机科学家；卷积神经网络发明者、图灵奖得主、机器智能世界模型范式的先驱。

基本信息/简介

项目	详情
全名	扬·安德烈·勒丘恩 (Yann André Le Cun)
出生信息	1960年7月8日，法国苏瓦西苏蒙莫朗西
国籍	法裔美国
现任机构	AMI Labs（执行主席）；纽约大学（雅各布·T·施瓦茨讲席教授）
研究领域	深度学习、卷积神经网络、计算机视觉、基于能量的模型、世界模型、图像压缩、机器人学
博士导师	莫里斯·米尔格拉姆 (Maurice Milgram)
博士论文	Modèles connexionnistes de l’apprentissage（连接主义学习模型），皮埃尔和玛丽·居里大学，1987年
个人网站	yann.lecun.com
X / Twitter	@ylecun
GitHub	github.com/ylecun
Google Scholar	scholar.google.com/citations?user=WLN3QrAAAAAJ
纽约大学教职员页面	engineering.nyu.edu/faculty/yann-lecun
ACM 图灵奖	amturing.acm.org/award_winners/lecun_6017366.cfm

概况

扬·勒丘恩是一位法裔美国计算机科学家，被广泛认为是卷积神经网络（CNN）的主要架构师——这类模型改变了计算机视觉，并推动了深度学习在2010年代的商业部署。他在法国接受教育，并在多伦多大学师从杰弗里·辛顿 (Geoffrey Hinton) 完成博士后研究。20世纪80年代末至90年代，他在贝尔实验室开发了LeNet，该网络曾大规模部署于美国各地的手写支票识别，其架构构成了当今几乎所有视觉识别系统的基础。2018年，他与辛顿和约舒亚·本吉奥 (Yoshua Bengio) 共同获得图灵奖，三人常被称为「深度学习之父」。他在Meta担任首席AI科学家长达十二年，领导基础人工智能研究（FAIR）实验室，并倡导开源AI开发。2025年11月，他离开Meta，创办了Advanced Machine Intelligence Labs (AMI Labs)，专注于世界模型架构。该公司在2026年3月筹集了10.3亿美元。他还在纽约大学库朗研究所担任雅各布·T·施瓦茨讲席教授，自2003年以来在兼顾行业职务的同时一直担任该职位。

早年生活与教育

在法国的童年与成长

勒丘恩于1960年7月8日出生在巴黎北部的郊区苏瓦西苏蒙莫朗西。他的姓氏源自布列塔尼语的古老形式 Le Cunff，根植于布列塔尼的甘冈地区；他的名字Yann是布列塔尼语中「让」(Jean) 的对应形式。他在法国长大，当时连接主义（即认为认知可以由简单单元网络建模的观点）在人工智能领域仍属少数派，而他早年就对学习机器的理论可能性产生了兴趣。在二十多岁快结束时，他发表了一些学习算法的提案，这些算法直到数十年后才得到充分验证。

ESIEE Paris (1980–1983)

勒丘恩于1983年获得ESIEE Paris的工程师文凭，这是一项遵循法国「大学校」传统的工程资格。该课程为他提供了扎实的数学和信号处理基础，这些知识后来影响了他对神经网络架构的研究方法。

皮埃尔和玛丽·居里大学 —— 博士 (1983–1987)

他于1987年在皮埃尔和玛丽·居里大学（现索邦大学）完成计算机科学博士学位，导师为莫里斯·米尔格拉姆。他的博士论文《Modèles connexionnistes de l’apprentissage》提出了早期形式的反向传播算法——与戴维·鲁梅尔哈特 (David Rumelhart)、杰弗里·辛顿和罗纳德·威廉姆斯 (Ronald Williams) 几乎同时独立完成——并将其应用于多层网络。1985年他在Cognitiva会议上发表的一篇论文描述了一种早期的非对称阈值网络学习方案，早于1986年鲁梅尔哈特-辛顿-威廉姆斯在《自然》杂志上发表的经典论文。

多伦多大学辛顿课题组博士后研究 (1987–1988)

在加入AT&T之前，勒丘恩在多伦多大学杰弗里·辛顿的指导下做了一年博士后研究员。在此期间，他加深了对神经网络训练动态的理解，并开始了影响该领域发展的学术合作。这一年巩固了勒丘恩、辛顿以及更广泛的多伦多研究小组之间的合作关系。

职业生涯

AT&T 贝尔实验室 —— 研究科学家 (1988–1996)

1988年，勒丘恩加入位于新泽西州霍尔姆德尔的AT&T贝尔实验室自适应系统研究部，由劳伦斯·杰克尔 (Lawrence Jackel) 领导。在八年时间里，他完成了奠定其科学遗产的工作。他于1989年发表的论文「Backpropagation Applied to Handwritten Zip Code Recognition」引入了成熟形式的卷积神经网络架构，将局部感受野、权重共享和空间下采样结合在一个受生物学启发的层级结构中，并通过反向传播进行端到端训练。到1998年，这一研究以LeNet-5的形式达到顶峰，该网络被设计用于端到端地识别手写数字，相关论文为「Gradient-Based Learning Applied to Document Recognition」（《IEEE论文集》，1998年，合作者包括莱昂·布图 (Léon Bottou)、约舒亚·本吉奥和帕特里克·哈夫纳 (Patrick Haffner)）。相关的银行支票识别系统被NCR等公司部署，在其鼎盛时期处理了美国约10%的支票。他还开发了最优大脑损伤算法（Optimal Brain Damage, NeurIPS 1990），这是一种基于原则的、用于去除冗余权重的剪枝技术——它是当今高效推理所依赖的模型压缩方法的前身——以及用于序列标注任务的图变换器网络（Graph Transformer Networks）。

AT&T 实验室-研究部 —— 图像处理部门主管 (1996–2003)

贝尔实验室分拆后，勒丘恩转至AT&T实验室-研究部，担任图像处理研究部门主管。这一时期的主要成果是DjVu，一种由他与莱昂·布图和帕特里克·哈夫纳共同开发的文档图像压缩格式，旨在实现扫描文档在网页上的高效分发，后被互联网档案馆采用。他还与布图共同开发了Lush编程语言，并与支持向量机的发明者弗拉基米尔·瓦普尼克 (Vladimir Vapnik) 进行了合作。在NEC研究所短暂担任研究员后，他于2003年加入纽约大学。

纽约大学 —— 雅各布·T·施瓦茨讲席教授 (2003年至今)

在纽约大学库朗数学科学研究所，勒丘恩在计算机科学、数据科学、神经科学以及电子与计算机工程系担任联合职务。他在纽约大学的研究聚焦于基于能量的模型（EBMs）——一种用于无监督和自监督学习的框架，该框架将推理视为能量景观上的优化问题，而非概率归一化——以及多阶段目标识别架构的特征学习。他与罗布·弗格斯 (Rob Fergus) 等人共同领导了纽约大学机器学习小组，培养了包括拉亚·哈德塞尔 (Raia Hadsell)、马可·奥雷利奥·兰扎托 (Marc’Aurelio Ranzato) 和科拉伊·卡武克丘奥卢 (Koray Kavukcuoglu) 在内的一代研究人员。2012年，他成为纽约大学数据科学中心的创始主任，并于2014年因在Meta的职责扩大而卸任。2013年，他与约舒亚·本吉奥共同创立了国际学习表征会议（ICLR），该会议后来成长为领域内最重要的学术会议之一。2016年，他担任法兰西公学院客座教授，并发表了计算机与数字科学讲席的就职演讲。2023年，他被任命为库朗研究所雅各布·T·施瓦茨讲席的首位获得者。

Meta (Facebook) AI —— 副总裁兼首席AI科学家 / FAIR 主任 (2013–2025)

2013年12月9日，勒丘恩成为纽约市Facebook AI Research (FAIR) 的首任主任。随着Meta的壮大，这一角色演变为副总裁兼首席AI科学家。他将FAIR建设成为最多产的学术型工业AI实验室之一，秉持公开发表与开源的哲学：FAIR在PyTorch（后来主导深度学习研究的框架）的开发与开源、大规模计算机视觉模型、公平性与鲁棒性基准测试以及自监督学习方法等方面发挥了关键作用。在任期间，他坚持其反主流的公开立场：他持续反对关于AI存在风险的各种叙事，挑战将大语言模型视为通往通用智能路径的框架，并坚持认为当前的AI系统缺乏在现实世界中稳健行动所必需的世界理解能力。2025年11月19日，勒丘恩确认在任职十二年后离开Meta，以创立自己的公司。

AMI Labs (Advanced Machine Intelligence Labs) —— 执行主席 (2025年至今)

勒丘恩于2025年末共同创立了Advanced Machine Intelligence Labs (AMI Labs)，由亚历克斯·勒布伦 (Alex LeBrun) 担任首席执行官，勒丘恩本人担任执行主席。该公司的研究论点是，大语言模型代表了一条通往人类水平机器智能的结构性死胡同，而正确的路径是构建「世界模型」——一种能够从多模态感官输入中学习物理世界的结构和动态的预测系统，从而能够实现安全的规划与行动，而非模式匹配的文本生成。2026年3月，AMI宣布完成由凯辉创新、Greycroft、Hiro Capital、HV Capital和贝佐斯探险队共同领投的10.3亿美元融资轮，投前估值为35亿美元。2026年1月，勒丘恩还成为Logical Intelligence公司技术研究委员会的创始主席，该公司正在开发基于能量的推理系统。

主要贡献

卷积神经网络 / LeNet —— 在1989年至1998年间于贝尔实验室开发了CNN架构，将受生物学启发的局部连接、权重共享和池化结合在一个通过反向传播进行端到端训练的层级结构中；论文「Gradient-Based Learning Applied to Document Recognition」（《IEEE论文集》，1998年）至今仍是计算机科学领域被引用最多的作品之一。
反向传播——早期独立公式 —— 在他1987年的博士论文中提出了一种实用的反向传播学习算法，独立于并与经典的鲁梅尔哈特-辛顿-威廉姆斯公式同时期提出。
最优大脑损伤 (NeurIPS 1990) —— 介绍了一种基于损失函数的Hessian矩阵计算的、基于原则的二阶网络权重剪枝方法；对模型压缩和高效推理做出了基础性贡献。
银行支票OCR系统 —— 将LeNet应用于NCR公司部署的商业系统，在其鼎盛时期处理了约10%的美国银行支票；是神经网络最早的大规模工业部署之一。
DjVu图像压缩 (1998年，与莱昂·布图和帕特里克·哈夫纳合作) —— 设计了一种针对扫描文本优化的文档图像压缩格式，在同等质量下实现了显著优于JPEG的压缩效果，并被互联网档案馆采用。
基于能量的模型 —— 发展了一个统一的、基于能量最小化而非概率归一化的监督、无监督和自监督学习理论框架，在2006年的一篇教程及后续工作中得到阐述；影响了现代对比学习和联合嵌入自监督方法的设计。
图变换器网络 —— 开发了结合卷积特征和结构预测的序列标注架构，应用于手写识别和OCR。
ICLR (2013年与约舒亚·本吉奥共同创立) —— 以开放同行评审流程建立了国际学习表征会议，现已成为最具竞争力和影响力的AI会议之一。
FAIR与PyTorch —— 领导Meta的基础人工智能研究实验室，并主导或推动了PyTorch的开源发布，PyTorch最终取代TensorFlow成为学术深度学习研究中的主导框架。
世界模型 / AMI Labs —— 阐述并正在积极构建从语言模型预训练到一种能够从多模态输入中学习物理现实预测模型的架构转变，从而实现安全的世界规划与行动。

奖项与荣誉

ACM图灵奖 (2018年，与杰弗里·辛顿和约舒亚·本吉奥共同获得) —— 计算机领域的最高荣誉，与另外两位「深度学习之父」共同获得，以表彰他们在神经网络的概念和工程突破方面的贡献。
IEEE神经网络先驱奖 (2014年)
PAMI杰出研究员奖 (2015年)
IRI奖章 (2018年)
宾夕法尼亚大学Harold Pender奖 (2018年)
AAAI会士 (2019年)
美国国家科学院院士 (2021年)
美国国家工程院院士
法国科学院院士
阿斯图里亚斯公主科学技术研究奖 (2022年，与辛顿、本吉奥和戴密斯·哈萨比斯共同获得)
法国荣誉军团骑士勋章 (2023年) —— 由法国总统授予。
VinFuture大奖 (2024年，与本吉奥、辛顿、黄仁勋和李飞飞共同获得)
伊丽莎白女王工程奖 (2025年，与本吉奥、比尔·达利、辛顿、约翰·霍普菲尔德、黄仁勋和李飞飞共同获得) —— 工程领域最高国际奖项。
荣誉博士学位：来自墨西哥城IPN (2016)、洛桑联邦理工学院 (2018)、蔚蓝海岸大学 (2021)、锡耶纳大学 (2023)、香港科技大学 (2023)。

关键人际关系

杰弗里·辛顿 —— 博士后导师与学术先驱；共同图灵奖得主；两人既共享荣誉，也偶有公开分歧，特别是在AI安全时间表方面，勒丘恩认为辛顿的警告被夸大了。
约舒亚·本吉奥 —— 共同图灵奖得主及ICLR联合创始人；合作撰写了里程碑式的LeNet论文以及2015年发表在《自然》杂志上的基础性综述文章「Deep learning」；两人有着长期并行且互补的研究历史。
莱昂·布图 —— 勒丘恩最为持久的研究合作伙伴，合作贯穿贝尔实验室、AT&T和FAIR时期；DjVu、Lush语言及随机梯度下降分析工作的共同发明者。
弗拉基米尔·瓦普尼克 —— AT&T实验室的同事，支持向量机的发明者；在核方法神经网络竞争主导地位的时期，两人曾进行过深入的思想交流。
拉亚·哈德塞尔 —— 纽约大学博士生，后成为DeepMind的顶尖研究员；她与勒丘恩在自主越野驾驶方面的研究是学习感知用于移动机器人的早期演示。
科拉伊·卡武克丘奥卢 —— 纽约大学及FAIR的合作者；后担任DeepMind研究副总裁；合作撰写了关于多阶段目标识别架构的论文。
马克·扎克伯格 —— 于2013年招募勒丘恩组建FAIR；他们长达十二年的工作关系使勒丘恩在一个由产品驱动的公司中获得了异常多的进行基础研究的自由。
亚历克斯·勒布伦 —— AMI Labs的首席执行官，勒丘恩于2025年创立的该公司；领导运营方面，而勒丘恩担任执行主席和首席研究策略师。

个人风格

勒丘恩是人工智能领域最具公开争议性的人物之一——他在社交媒体上非常活跃，乐于指名道姓地指出他认为是错误的观点，并且在他认为该领域正走向错误方向时，丝毫不介意使用外交辞令。他对AI末日论的拒绝是明确而始终如一的：多年来他一直认为对近期超级智能风险的担忧是误导性的，并且当前的系统，包括大语言模型在内，缺乏达到人类水平智能所需的结构性特征。他于2026年4月在布朗大学的演讲很好地体现了这种风格——他向座无虚席的观众直言「AI很烂」，并且在勒丘恩看来，当前以LLM为中心的投资是「彻头彻尾的胡扯」——他在这些观点成为流行反论之前就已实质性地持有。在技术上，他以其架构性思维著称：他最持久的贡献（CNN、基于能量的模型、世界模型）并非单个算法，而是重新组织了一类问题处理方式的框架。他一直是开放科学的坚定倡导者，在竞争对手对研究保密时，他在FAIR推动了公开发表。他的布列塔尼血统在他身上也体现出些许自豪感：他签名时使用 Yann 而非Jean，并在被问及时会提及这个名字的词源。