大卫·哈

Sakana AI 联合创始人兼CEO,以在线身份 hardmaru 闻名——前高盛董事总经理,自学成才的神经网络研究员。他曾在高盛担任董事总经理,后自学成为神经网络研究员。他的匿名博客、创意机器学习实验以及关于世界模型和超网络的论文,使他在创办日本最具价值的 AI 公司之一之前,就成为该领域最独特的声音之一。


个人简介

领域 详情
国籍 加拿大
现任机构 Sakana AI(联合创始人及CEO)
研究方向 神经进化、世界模型、集体智能、创意AI、自然启发计算、自动化科学发现
教育背景 多伦多大学工程科学与应用数学学士/硕士
个人网站 otoro.net
博客 blog.otoro.net
X / Twitter @hardmaru
GitHub @hardmaru
Google Scholar scholar.google.com

概述

David Ha(以在线昵称 hardmaru 广为人知)是加拿大裔 AI 研究员兼企业家,他于2023年7月在东京联合创立了 Sakana AI。这家公司——其名称取自日语中的「鱼」一词,寓意鱼群的集体智慧——是日本估值最高的AI初创公司之一,在2025年底完成B轮融资后估值约为26亿美元。Ha 走到今天这一步的路径在当代AI界中堪称最非传统:他在高盛担任董事总经理十多年,在日本从事固定收益证券交易,之后才发现机器学习,通过书籍和匿名研究博客自学成才,并因此吸引了谷歌的注意,于2016年通过谷歌大脑实习项目进入该领域。他在谷歌大脑随后进行的研究——包括超网络、Sketch-RNN 和世界模型——使他成为生成式建模、强化学习和神经进化交叉领域中一个既富有创意又技术严谨的声音。在Sakana AI,他将这些主题拓展至受自然启发的基础模型和自动化科学发现,其中最引人注目的是AI科学家——一个全自动研究系统,其论文于2026年发表在《自然》期刊上。


早年生活与教育

Ha 在加拿大长大,在多伦多大学攻读工程和应用数学,完成了工程科学和应用数学的本科学位及硕士学位。这些课程所灌输的数学严谨性与系统思维,在他后来的研究风格中清晰可见——一种偏好简洁优雅的架构而非盲目扩大规模的倾向。


职业生涯

高盛——日本固定收益部门董事总经理

在进入机器学习领域之前,Ha 在高盛工作了大约十年,最终升至董事总经理级别,共同负责日本的固定收益交易业务。在东京的这段经历建立了他在职业和个人上与日本的联系,这后来成为他决定在东京创立AI公司的基础。量化金融的经验——构建市场模型、管理不确定性、用高维环境的压缩表征进行思考——在概念上与后来他追求的统计学习方法紧密相邻。Ha 将这一转变描述为:一旦他认识到其中的数学重叠,便觉得顺理成章。

自主学习与 otoro.net 博客(约2014-2016年)

在申请任何正式的机器学习项目之前,Ha 便开始在博客(blog.otoro.net)和个人网站(otoro.net)上以 hardmaru 这个化名进行并发表自己的实验——这个化名源自日语中的「大トロ」(Ōtoro),即高级肥美的金枪鱼部位。他简单地描述了自己的理念:“我用神经网络做简单的东西。” 该博客吸引了机器学习社区大量的自然关注,多篇文章在 Hacker News 上走红。正是这个匿名博客活动直接吸引了谷歌大脑的注意,后者主动联系他并邀请他加入实习项目——这是近期AI史上一个引人注目的例子,真正的技术人才在体制外被发现。

谷歌大脑实习项目与研究科学家(2016-2022年)

Ha 于2016年通过谷歌的研究实习项目加入谷歌大脑,之后继续担任研究科学家。他最终被任命领导谷歌大脑东京团队,成为谷歌最高产的国际研究节点之一的负责人。他在谷歌大脑的产出涵盖创意AI、神经进化和基于模型的强化学习:

超网络 (2016): 与 Andrew Dai 和 Quoc Le 合著,超网络提出使用一个神经网络来生成另一个网络的权重。这种元网络产生另一个网络参数的想法引入了一种架构模块性和权重共享的形式,影响了后续在神经架构搜索、模型压缩和持续学习方面的工作。

Sketch-RNN (2017, 发表于 ICLR 2018): 与 Douglas Eck 合著,Sketch-RNN 在数千张人类绘制的草图上训练了一个循环神经网络,以生成基于笔画的图画——以笔触序列而非像素网格的形式生成连贯的、类似人类对猫、消防车和人脸的表征。它既是序列到序列生成式建模的技术贡献,也是神经网络能做什么创造性工作的公开演示;交互式 Quick, Draw! 网络演示吸引了数百万用户。

世界模型 (2018, NeurIPS): 与 Jürgen Schmidhuber 合著,世界模型证明了一个强化学习智能体可以学习其环境的压缩空间和时间模型(通过 VAE 和 RNN),然后完全在其自我想象的梦中训练一个简单的控制器——一种基于模型的RL方法,在赛车和 VizDoom 环境中取得了最先进的结果,同时使用的参数远少于无模型替代方案。该论文成为基于模型的RL领域被引用最多的贡献之一,并引入了一个现在标准化的架构词汇(V-M-C:视觉、记忆、控制器)来思考智能体认知。

自解释智能体的神经进化 (2020): 使用基于注意力的神经进化来训练智能体,突出显示它们用于决策的输入的具体特征——产生了可直接可视化和解释其推理过程的智能体,无需事后解释方法。

作为Transformer的感觉神经元 (2021): 演示了用于RL的置换不变神经网络,其中每个感觉输入与共享权重Transformer独立处理,使智能体能够跨不同的观察顺序和配置进行泛化。

Stability AI——研究主管(2022-2023年)

离开谷歌大脑后,Ha 加入 Stability AI 担任研究主管,负责下一代 Stable Diffusion 版本和其他生成式模型项目的技术方向。他的任期架起了谷歌时期的世界模型与创立 Sakana AI 之间的桥梁。

Sakana AI——联合创始人及CEO(2023年7月至今)

2023年7月,Ha 与 Llion Jones(原始Transformer论文《Attention Is All You Need》的合著者)以及 Ren Ito(前外交官)在东京联合创立了 Sakana AI。公司的名称和创立理念直接借鉴了集体自然系统的类比:正如遵循简单规则的个体鱼类产生鱼群复杂的涌现行为,Sakana 追求由进化、交互的较小组件构建的AI系统,而不是单一的巨型规模化模型。

融资时间线:

  • 种子轮(2024年初):Lux Capital, Khosla Ventures, 500 Global,以及包括 Jeff Dean, Clément Delangue 和 Alexandr Wang 在内的天使投资人。
  • A轮融资(1亿美元,2024年6月):New Enterprise Associates, Khosla Ventures, Lux Capital, NVIDIA(战略投资和合作);估值超过10亿美元——日本有史以来最快达到独角兽地位的私营公司。
  • B轮融资(200亿日元 / 约1.35亿美元,2025年11月):MUFG, Klux Capital, In-Q-Tel;估值约为26-26.5亿美元(4000亿日元)。谷歌作为合作伙伴关系的一部分单独进行了战略投资。

模型融合与进化AI (2024): Sakana 的第一个广受关注的技术贡献是一种通过「繁殖」现有模型来构建新AI模型的方法——通过进化选择融合多个预训练模型,而不是从头开始训练。这种方法大幅降低了生成专业模型所需的计算量,并直接实现了Ha长期以来对进化计算作为梯度下降替代方案的兴趣。

AI科学家 (2024-2026): Sakana AI 迄今为止最突出的研究成果,与牛津大学的 Foerster 实验室和英属哥伦比亚大学的 Jeff Clune 团队合作开发。AI科学家是一个框架,使基于大语言模型的智能体能够自主执行完整的科学研究循环:生成假设、编写并运行实验、分析结果以及撰写手稿。最初的预印本(2024年8月)引起了强烈关注;完整论文于2026年发表在《自然》期刊上,这既是自动化发现的里程碑,也代表了Sakana科学可信度的里程碑。


主要贡献

  • 超网络 —— 引入了元网络生成目标网络权重的概念,实现了跨架构的参数共享,并影响了后续大量关于自适应神经网络、元学习和模型生成的工作。

  • Sketch-RNN —— 一种在人类绘制的矢量草图上训练的生成式RNN,能产生连贯、抽象、基于笔画的物体表征;证明了神经网络可以捕捉人类绘画的姿势性和顺序性,并通过 Quick, Draw! 数据集和交互式演示普及了创意AI。

  • 世界模型 —— 确立了用于基于模型的RL的 V-M-C(视觉、记忆、控制器)框架,表明在一个完全学习的幻觉环境中训练的紧凑智能体可以解决复杂任务;是该领域最有影响力的基于模型的RL论文之一。

  • 自解释智能体的神经进化 —— 将注意力机制与进化优化相结合,以产生其决策可直接从其视觉输入解释的智能体,无需事后解释。

  • 模型融合 / 进化式AI融合 —— Sakana AI 通过从预训练父代中繁殖和选择来创建新模型的方法,将进化计算作为创建专业模型的实用预训练替代方案。

  • AI科学家 —— 第一个用于全自动科学发现的综合系统:一个由基础模型驱动的智能体,能生成研究想法、设计和运行实验、解释结果并撰写论文——于2026年发表在《自然》期刊上。

  • otoro.net 博客 —— 一个异常有影响力的非正式研究产物:个人博客,匿名进行机器学习实验,多篇文章在 Hacker News 上走红,共同证明了严谨、创造性的机器学习研究可以在机构结构之外进行和传播——并且可以凭自身实力吸引机构的关注。


奖项与认可

  • NeurIPS 2018 最佳论文 / 世界模型影响 —— 世界模型论文成为其时代基于模型的RL中被引用最多的贡献之一。
  • TIME100 AI —— 入选《时代》杂志2023年AI领域最具影响力人物榜单。
  • 谷歌大脑实习项目 (2016) —— 基于独立博客研究入选谷歌有竞争力的机器学习实习项目。
  • 日本AI生态系统领袖 —— 被认为是构建日本AI初创公司基础设施的核心人物,Sakana AI 被定位为日本的旗舰AI研究公司。

关键关系

  • Llion Jones —— Sakana AI 联合创始人;《Attention Is All You Need》(2017年)原始作者之一;他的Transformer背景与Ha的神经进化背景共同定义了Sakana的技术广度。
  • Ren Ito —— Sakana AI 联合创始人;前外交官,其对日本的制度性了解帮助Sakana在日本政府和公司AI生态系统中定位。
  • Jürgen Schmidhuber —— 世界模型合著者;LSTM和元学习先驱,其长期在自指系统和压缩世界模型方面的工作与Ha的研究理念紧密相连。
  • Jeff Dean —— 谷歌高级研究员,Sakana种子轮天使投资人;Ha在谷歌大脑任期后以战略合作伙伴身份重返谷歌,对日本AI生态系统具有象征意义。
  • Andrej Karpathy —— Ha最知名的专业追随者之一;两人都对机器学习研究的创意和教育维度感兴趣,并且都处于研究和公众沟通的边界。
  • Douglas Eck —— 在Sketch-RNN项目上的谷歌大脑合作者;Eck在Magenta领导、Ha独立追求的创意AI研究方向在谷歌大脑时期有大量重叠。

个人风格

Ha的研究风格以对极简主义和生物学合理性的承诺为特征——一种本能的追问:智能能否从简单、紧凑的规则中涌现,而非规模?他的 otoro.net 标语(“我用神经网络做简单的东西”)并非虚假的谦虚,而是一种真正的方法论立场:Sketch-RNN、世界模型和神经进化论文都偏爱紧凑架构和压缩表征,而非主导该领域大部分工作的参数数量最大化。这种风格与Sakana AI的创立论点直接相关,后者将鱼群的涌现集体行为——而非任何单条鱼的大小——视为智能的正确模型。他从匿名博主到谷歌大脑研究员再到初创公司CEO的转变,也反映了他与机构认可之间不同寻常的关系:他通过发布他自己觉得有趣的工作来建立声誉,没有战略规划,然后让社区去发现。他在X平台上的公众沟通也延续了这种精神——信息量大,经常带点趣味性,很少自我推销——而他的 Digg vibe 档案(「告知」和「充满希望」占主导,「引人深思」存在但次要)捕捉到了一个对可能性比对辩论更感兴趣的沟通者。


参考资料