Thomas Wolf

ref · 2026 年5 月 25 日 07:02

Hugging Face 联合创始人兼首席科学官 — Transformers 库的创建者、BigScience/BLOOM 倡议的架构师，也是过去十年间开放源代码 AI 民主化进程中影响力最大的个人。

简介

领域	详情
国籍	法国
现任机构	Hugging Face（联合创始人兼首席科学官）
研究领域	开源机器学习基础设施、大型语言模型、多语言 AI、机器人学、科学 AI
博士学位	统计与量子物理学，巴黎第六大学（皮埃尔和玛丽·居里大学 / 索邦大学）
个人网站	thomwolf.io
X / Twitter	@Thom_Wolf
GitHub	@thomwolf
Google Scholar	scholar.google.com（被引用超过 58,000 次）

概述

Thomas Wolf 是 Hugging Face 的联合创始人兼首席科学官。该公司已成为开源 AI 生态系统的核心基础设施层。他是 Hugging Face Transformers 库的主要作者——该库为几乎所有主要的预训练模型家族提供了统一、生产质量的实现，并已成为全球应用 NLP、视觉和多模态 AI 的事实标准接口。他领导了 BigScience 研讨会（2021–2022），这是一项持续一年的全球协作项目，涉及一千多名研究人员，最终产出了 BLOOM——第一个在参数规模上超过 GPT-3 的公开许可大型语言模型。除了 Transformers，Wolf 还创建或领导了 Datasets、Diffusers、Accelerate、DataTrove、smolagents 和 LeRobot 等库的开发，构建了世界上大多数 AI 从业者使用的开源工具包。他的职业生涯轨迹与众不同：他最初是一名物理学家，当了五年的专利代理人，通过法律客户接触到机器学习，并在 2016 年没有任何计算机科学正规背景的情况下联合创立了 Hugging Face——然而他却构建了 GitHub 历史上使用最多的软件仓库之一，并帮助公司将估值推高至 45 亿美元。

早期生活与教育

Wolf 在法国出生并长大。他在巴黎综合理工学院（法国顶尖的精英工程师学院之一）攻读理论物理学和数学的本科学位。

博士学位，统计与量子物理学 — 巴黎第六大学（皮埃尔和玛丽·居里大学 / 索邦大学）
Wolf 的博士研究涉及量子场论和统计场论。在攻读博士学位期间，他教授物理学——这段经历他后来描述为一种怀念——并在劳伦斯伯克利国家实验室担任研究实习生，研究激光等离子体加速器产生 X 射线。他的博士训练跨学科，融合了数学、统计力学和实验物理学，这在他后来发现机器学习的许多技术本质上是重新包装了的统计物理学时，被证明是出乎意料地相关。

法学学位 — 先贤祠-索邦大学
在获得博士学位后，Wolf 走上了第二条学术道路，并在巴黎获得了法学学位。

知识产权 — 国际知识产权研究中心 (CEIPI)
Wolf 还在 CEIPI（法国专门的知识产权研究所）学习了知识产权法，完成了成为欧洲专利代理人所需的资格认证。

职业生涯

劳伦斯伯克利国家实验室 — 研究实习生

在博士期间，Wolf 在美国劳伦斯伯克利国家实验室实习，研究激光等离子体物理学。这种早期对美国研究文化和国际学术环境的接触，预示了他后来的跨大西洋职业生涯。

Cabinet Plasseraud — 专利代理人，巴黎（约 2009–2015 年）

在完成博士和法学学习后，Wolf 加入了巴黎主要的知识产权事务所 Cabinet Plasseraud 工作，担任欧洲专利代理人约五年。他的客户组合主要包括深度学习、机器学习和 AI 初创公司——这是一个非同寻常的视角，使他能够观察神经网络方法的早期商业部署。他将自己转向 AI 描述为部分偶然：为科技公司提供知识产权咨询让他接触到底层数学，他认出这正是以新符号出现的熟悉的统计物理学。这种认识促使他在法律实践之余，通过书籍和在线课程开始了机器学习的自学。

Hugging Face — 联合创始人兼首席科学官（2016 年至今）

2016 年，Wolf 与 Clément Delangue 和 Julien Chaumond 在纽约市联合创立了 Hugging Face。该公司最初是针对青少年的一款消费级聊天机器人应用——该名称源于表情符号，社区自然地采用了它，并成为公司身份的永久元素。这款聊天机器人获得了适度的关注，但转折点来自一个附带决定：当团队将他们内部构建的 NLP 工具开源时，开发者社区的反应是即时且压倒性的。Wolf 领导了向基础设施的技术转型，Transformers 库由此诞生。

Transformers 库（2019 年至今）
Wolf 架构并发布了 Hugging Face Transformers 库，为 BERT、GPT-2、T5、RoBERTa 以及随后数百种预训练模型架构提供了统一的 PyTorch、TensorFlow 和 JAX 实现。在 Transformers 出现之前，使用每个模型都需要查阅原始研究代码——这些代码通常不完整、文档不一致，并且特定于某个框架。Transformers 统一了接口，标准化了 API，并将其与 Hugging Face Hub 配对用于模型托管和共享。该仓库在 GitHub 上已获得数百万星标，并被大多数涉及预训练模型的学术 ML 论文所导入；它充当了世界所称的「AI」背后的大部分管道。

Datasets 库（2020 年至今）
Wolf 共同开发了 Datasets 库，提供标准化、内存高效的数千个 ML 数据集访问，具有统一的 API、由 Apache Arrow 支持的快速加载功能以及与 Hugging Face Hub 的集成。它将数据集获取和预处理的繁琐工作减少到几行代码，消除了应用 ML 研究中主要的可复现性和访问瓶颈。

BigScience 研讨会和 BLOOM（2021–2022 年）
Wolf 领导了 BigScience 研讨会，这是他于 2021 年 4 月开始组织的一项为期一年的开放科学合作项目，最终涉及来自六十多个国家的一千多名研究人员，并获得了 GENCI 和 IDRIS（法国国家超级计算中心）的重大计算贡献。该项目产出了 BLOOM——一个拥有 1760 亿参数的多语言语言模型，在 46 种自然语言和 13 种编程语言上进行训练，于 2022 年 7 月根据负责任的 AI 许可协议 (RAIL) 发布。BLOOM 在发布时是最大的可公开访问的语言模型，而 BigScience 过程为前沿 AI 的开放协作开发建立了一个模板——这一模式影响了后续的 Falcon、Mistral 和 Llama 发布。

Diffusers、Accelerate、DataTrove、smolagents（2022 年至今）
Wolf 继续扩展 Hugging Face 库生态系统：Diffusers（2022 年）成为扩散模型推理和训练的标准库；Accelerate 提供与硬件无关的分布式训练抽象；DataTrove（2024 年）解决了预训练的大规模数据处理问题；smolagents（2024–2025 年）提供了构建轻量级 AI 智能体的框架。

LeRobot 与机器人学转型（2024 年至今）
2024 年，Wolf 开始将 Hugging Face 开源工作的很大一部分转向机器人学，明确遵循 Transformers 的剧本：构建开放基础设施，发布数据集，并降低硬件领域的准入门槛。LeRobot，这个开源的机器人学习库，在发布后的几个月内就成为 GitHub 上最广泛使用的开放机器人学平台。2025 年 4 月，Hugging Face 收购了 Pollen Robotics，将开源硬件（Reachy 2 人形机器人）添加到软件栈中。Wolf 将机器人学的赌注描述为「与几年前我们在 LLM 领域所处的物理 AI 的转折点相同」。SO-100 机械臂——一个与 LeRobot 同时推广的配套硬件项目——被明确设计为成本低于 100 美元，体现了在硬件层面的民主化精神。

Hugging Face Hub 与平台增长
在 Wolf 的科学指导以及 CEO Clément Delangue 和 CTO Julien Chaumond 的领导下，Hugging Face 已从一个消费级应用发展成为世界上最大的公共 AI 模型、数据集和演示仓库。Hub 托管着数百万个模型和数据集，服务于超过七百万用户，并已吸引投资将公司估值推高至 45 亿美元（2023 年 D 轮融资）。截至 2025 年，公司约有 250 名员工。

主要贡献

Hugging Face Transformers — 将支离破碎的预训练模型格局统一为一个单一、维护良好、文档齐全的 Python 包；现在是全球使用神经语言、视觉和多模态模型工作的默认接口。其开放访问发布使得最先进的 NLP 无需博士学位或企业预算即可获得。
BLOOM 和 BigScience 研讨会 — Wolf 组织并领导了第一次大规模开放协作开发前沿 LLM（1760 亿参数，46 种语言），既产出了一个模型工件，也为社区主导的规模化开放科学建立了一个过程模板。
Hugging Face Hub — 共享模型、数据集和演示的平台，Wolf 帮助将其建设成为全球 AI 从业者社区的核心基础设施——被观察者称为「机器学习的 GitHub」。
Datasets 库 — 以内存效率和可复现性优先的设计统一了数据集访问；为缺乏大型存储或计算基础设施的研究人员和开发者消除了 ML 研究中的一个主要实际障碍。
Diffusers — 扩散模型推理和训练的标准开源库，使得稳定扩散变体以及后续图像和音频生成模型得到广泛采用。
LeRobot — 开源机器人学习库，旨在为物理 AI 带来与 Transformers 为 NLP 带来的同样可访问、社区驱动的基础设施；在其第一年内成为领先的开放机器人学平台。
FineWeb 与超大规模手册 — FineWeb 是一个高质量的 LLM 预训练开放数据集（15 万亿 token）；超大规模手册是一份关于高效训练大型模型的开放教育资源——两者都体现了 Wolf 发布前沿 AI 背后工作知识（而不仅仅是工件）的理念。
《基于 Transformers 的自然语言处理》（O’Reilly 出版，与 Lewis Tunstall 和 Leandro von Werra 合著）——使用基于 Transformer 模型的从业者的参考教科书，被广泛用于课程和行业开发者。
smolagents — 构建 AI 智能体的轻量级框架，反映了 Wolf 当前对能够作用于世界而非仅仅预测文本的 AI 的关注。

奖项与认可

世界经济论坛 — 演讲者和参与者；被公认为开放 AI 和技术民主化的领军声音。
TED 演讲（2025 年 3 月）——发表 TED 演讲倡导开源 AI。
Google Scholar 引用 — 超过 58,000 次引用，主要由 Transformers 库论文、BLOOM 论文和 BigScience 数据集论文驱动——对于未完成传统 ML 博士学位的人来说，这是一个不寻常的引用概况。

主要关系

Clément Delangue — Hugging Face 的 CEO 和联合创始人；Delangue 领导业务和战略，而 Wolf 领导科学方向；他们互补的角色定义了该公司作为商业平台和开放科学机构的双重身份。Delangue 是 Wolf 最紧密的专业联系之一。
Julien Chaumond — CTO 和联合创始人；创始团队的第三支柱，在 Wolf 推动科学和开源议程的同时负责工程架构。
Yann LeCun — Wolf 最著名的专业追随者之一；LeCun 在 Meta 倡导开放 AI 发展与 Wolf 在 Hugging Face 的理念高度一致；两人代表了该行业中最引人注目的开放源代码对封闭 AI 发展的制衡力量。
Rémi Cadène — 前特斯拉 Optimus 科学家，加入 Hugging Face 领导 LeRobot 项目；Wolf 在机器人学转型方面的关键合作者。
BigScience 社区 — 一千多名研究者在 Wolf 的组织指导下共同创建了 BLOOM；这种关系定义了他独特的科学协作模式——组织分布式的科学劳动力，而非领导传统的实验室。

个人风格

Wolf 的职业生涯遵循一条与通常的 AI 传记相抵触的轨迹：理论物理学家，然后是专利律师，紧接着是自学成才的机器学习工程师，再到开源基础设施架构师。他将从法律到 ML 的转变描述为认识到深度学习的数学基础正是他已经知道的统计物理学——这是一种模式匹配行为，体现了他习惯于在看似无关的领域之间发现结构相似性。他对开放科学的承诺并非空谈：他始终选择发布可运行、经过维护的代码和数据，而不是关于计划发布的论文，并且他将自己最大的项目（BigScience、FineWeb、LeRobot）组织为协作性的社区努力，而非专有研究项目。他的 Digg 个人资料氛围（主要是「告知」和「希望」，很少「挑衅」）捕捉到了一位更有兴趣分享他正在构建的东西而非追求辩论得分的信息传达者，尽管他对封闭式 AI 开发有直接的看法。他提到自己仍然怀念作为博士生讲师时教学的时光，他的博客文章、教育手册和合著书籍反映了他持续致力于解释（而不仅仅是构建）的并行承诺。