機械学習の理論家であり、AI研究のリーダー。AI for Scienceの最前線でタンパク質構造予測を同時に進展させ、ByteDance SeedでLLMの事前学習とスケーリングを共同で指揮した。
| 生誕 | c. 1984年、中国 |
| 国籍 | 中国系アメリカ人 |
| 現在の所属機関 | カリフォルニア大学ロサンゼルス校 コンピュータサイエンス学科(終身在職権を持つ准教授、休職中);ByteDance Research(研究員、2023年7月~2026年6月、離職済み) |
| 研究分野 | 非凸最適化、深層学習理論、強化学習、大規模言語モデル、AI for Science(タンパク質設計・構造予測)、拡散モデル |
| 博士論文指導教官 | Jiawei Han |
| 博士論文 | 大規模ネットワークのオンライン学習と能動学習:理論とアルゴリズム(イリノイ大学アーバナ・シャンペーン校、2014年) |
| ウェブサイト | web.cs.ucla.edu/~qgu |
| X / Twitter | @QuanquanGu |
| Google Scholar | Quanquan Gu |
概要
Quanquan Guは中国系アメリカ人の機械学習研究者であり、UCLAの終身在職権を持つコンピュータサイエンス准教授。深層学習、非凸最適化、強化学習への厳密な理論的貢献で知られる。2023年7月から2026年6月までByteDance Seedで研究員を兼任し、二つの異なる研究フロントを率いた。まず、業界で最も競争力のあるAI for Protein Scienceのスタックの一つを構築し、その後、Seed 2.0の開発を支えるLLM最適化・スケーリングチームを共同設立するために軸足を移した。ML理論、生物学的AI、大規模事前学習——これらが一人の研究者に重なることは稀——に対する彼の並行した指揮は、学界と産業界の両方で持続的な注目を集めた。2026年6月にByteDanceを離れ、「最高のモデルはまだこれからだ。スケーリングは続く」という言葉を残して去ったが、次の行き先は明かさなかった。
生い立ちと教育
Guは清華大学で学部教育を修了し、制御工学の学士号(2003年~2007年)を取得後、同大学で制御科学・工学の修士号(2007年~2010年)を取得。その後、米国に渡り、イリノイ大学アーバナ・シャンペーン校(UIUC)でデータマイニングと知識発見の分野で最も引用されている研究者の一人であるJiawei Hanの指導の下で博士号を取得した。博士論文『大規模ネットワークのオンライン学習と能動学習:理論とアルゴリズム』は、急速に進化する大規模情報ネットワークを効率的に学習するという課題に取り組み、オンライン学習アルゴリズムと能動学習戦略を組み合わせたものだった。2014年に博士号を取得し、博士課程在学中にUIUCコンピュータサイエンス学科フェローシップ(2010年)とIBM PhD Fellowship(2013年~2014年)を受賞した。卒業後は、プリンストン大学オペレーションズリサーチ・金融工学科で博士研究員として1年間過ごした(2014年~2015年)。
キャリア
バージニア大学(2015年~2018年)
GuはUVaに任期付き助教授として加わり、当初はシステム&情報工学科に所属(2015年~2017年)。2016年から2018年に離職するまでコンピュータサイエンス学科の兼任も務めた。この期間に、非凸最適化と深層学習の理論的基盤に関する研究アジェンダを確立し、確率的分散低減法や過剰パラメータモデルの統計的学習理論に関する初期の研究を発表した。UVa在籍中にNSF CAREER Award(2017年)とUVa SEAS Research Innovation Award(2017年)を受賞し、プライバシーと高次元データを考慮した機械学習に関する複数のNSF助成金を獲得した。
カリフォルニア大学ロサンゼルス校 コンピュータサイエンス学科(2018年~現在)
Guは2018年7月にUCLAの任期付き助教授として着任し、2022年7月に終身在職権を持つ准教授に昇進。現在はUCLA Artificial General Intelligence Labを率いている。彼の研究グループは、相互に関連する4つの分野で substantial な成果を生み出してきた。
最適化と深層学習理論において、研究室は過剰パラメータネットワークにおける確率的勾配降下法(SGD)の厳密な汎化限界を導出し、2層畳み込みニューラルネットワークにおける良性過学習の特性を明らかにし(NeurIPS 2022, Oral)、一連の論文でSGDの暗黙的正則化を分析した。MARS最適化器(ICML 2025)は大規模モデル学習のための新しい分散低減フレームワークを導入し、Tensor Product Attention(NeurIPS 2025, Spotlight)は新しいアテンション機構アーキテクチャを提案した。
強化学習において、グループは線形マルコフ決定過程と線形混合MDPに対して、ほぼミニマックス最適なサンプル複雑度の結果を確立し(COLT 2021、ICML 2021、ICML 2023)、関数近似を用いた証明可能な効率的RLの厳密な理論に貢献した。
言語モデルのアライメントとファインチューニングにおいて、GuはSelf-Play Fine-Tuning(SPIN, ICML 2024)を共同開発。これは、追加の人間によるアノテーションを必要とせず、言語モデルが自身の前回のイテレーションの出力と対戦することで反復的に改善する手法であり、テキストから画像への生成のための拡散モデルにも拡張された(NeurIPS 2024)。Self-Play Preference Optimization(SPPO, ICLR 2025)はこれを原則的なアライメント手法へと洗練させた。
AI for Scienceにおいて、UCLAベースの構造ベース創薬(DecompDiff, ICLR 2024; DecompOpt, ICLR 2024)とタンパク質コンフォメーションモデリング(ICML 2024)に関する研究は、Guが後にByteDanceで主導することになる産業規模の生物学研究に直接的に先行し、情報を与えた。
COVID-19パンデミック期間中(2020年~2021年)、彼のチームはUCLA SuEIR疫学モデルを開発。これは米国疾病予防管理センター(CDC)が累積死亡者数と入院者数の週次予測に使用し、その結果はPNASに掲載された(2022年、2023年)。
Guはまた、サイモンズ計算理論研究所で2度の長期研究滞在を行っている。バークレーでの深層学習の基礎サマープログラムの研究員(2019年5月~8月)、および強化学習理論プログラムの長期参加者(2020年8月~12月)として。また、プリンストン高等研究所の最適化、統計、理論的機械学習に関する特別年度の短期滞在者でもあった(2019年10月~11月)。
ByteDance Research(2023年7月~2026年6月)
Guは2023年7月にByteDance Researchに加わり、同社のAI for Drug Discoveryイニシアチブを主導。同時にUCLAの教職は休職という形で継続した。約18ヶ月の間に、彼のチームは計算生物学の分野で3つの主要な成果を生み出した。
SeedFold(arXiv: 2512.24354、2025年12月)は、AlphaFold 3アーキテクチャを三つの軸——モデル幅、線形三角注意によるアーキテクチャ効率、大規模蒸留によるデータ量(2650万トレーニングサンプル)——でスケーリングする生体分子構造予測システム。FoldBenchでベンチマークした結果、SeedFoldはモノマー予測、タンパク質間ドッキング、抗体-抗原複合体、タンパク質-リガンド結合など、ほとんどのタンパク質関連タスクでAlphaFold 3を上回った。
SeedProteo(arXiv: 2512.24192、2026年2月)は、拡散ベースのデノボ全原子タンパク質バインダー設計システム。SeedFoldのフォールディングアーキテクチャを生成フレームワークとして再利用し、自己条件付け特徴を統合して設計プロセスをガイドする。無条件生成では最大1000残基の配列を処理し、バインダー設計ベンチマークではAlphaProteo、RFDiffusion、Chai-2、BinderCraft、BoltzGenを上回った。PD-L1およびSC2RBD標的に対するin vitro検証により、実験的に発現され結合するバインダーが確認された。
DPLM / DPLM-2は、拡散タンパク質言語モデルのファミリー(ICML 2024; ICLR 2025; ICML 2025に拡張)。タンパク質表現学習、無条件生成、およびフォールディング、逆フォールディング、モチーフ足場などを含む任意の条件付き生成を、単一の離散拡散事前学習目的の下で統合する。DPLM-2は、このフレームワークを拡張し、配列と3D構造を単一の事前学習済みバックボーンで共同モデリングする。
2025年初頭、DeepSeekの話題となったリリースにより中国でのLLM競争が激化したことを受けて、GuはByteDanceのフロンティアモデルへの取り組みに軸足を移し、Seed事前学習グループ内でLLM最適化・スケーリングチームを設立した。このチームはスケーラブルな事前学習スタックをゼロから構築し、Guの退任の約4ヶ月前にByteDanceの主力フロンティアモデルであるSeed 2.0の開発とリリースに直接貢献した。Seed 2.0の機能を統合したByteDanceのAIアシスタントDoubaoは、2026年半ばまでに約3億3600万人の月間アクティブユーザーに達していた。
Guは2026年6月3日にByteDance Seedからの退任を発表し、同僚に「非常にやりがいのある旅でした」と感謝の意を述べたが、次の動向は明らかにしなかった。
主な貢献
- SeedFold — FoldBenchの広範なタスクにおいてAlphaFold 3を凌駕した初の産業配備生体分子構造予測システム。アーキテクチャのスケーリング、線形注意、大規模データ蒸留(2650万サンプル)を組み合わせる。
- SeedProteo — 最先端のデノボ全原子タンパク質バインダー設計モデル。インシリコベンチマークで主要なオープンソース競合他社をすべて上回り、実験的なin vitro検証を伴う。seedfold.ioで公開配備中。
- DPLMシリーズ — 表現学習と条件付き/無条件生成を統合した拡散タンパク質言語モデルのファミリー(ICML 2024、ICLR 2025)。DPLM-2は単一の事前学習済みバックボーン内で配列と3D構造を共同モデリングする。
- Seed 2.0事前学習スタック — ByteDanceのスケーラブルなフロンティア事前学習インフラを構築したLLM最適化・スケーリングチームを共同指揮。Seed 2.0およびその後のモデルを直接的に支えた。
- Self-Play Fine-Tuning (SPIN) — 追加の人間によるアノテーションを必要とせずに反復的な改善を可能にする言語モデル自己改善フレームワーク(ICML 2024)。拡散モデル(NeurIPS 2024)および嗜好最適化(SPPO, ICLR 2025)に拡張。
- 良性過学習理論 — SGDによって訓練された過剰パラメータニューラルネットワークが、訓練データを補間しながらも汎化する条件を特徴づける一連の論文(NeurIPS 2022 Oral; COLT 2021; JMLR 2024)。現代の深層学習における広範な経験的現象に厳密な基盤を提供。
- 証明可能な効率的強化学習 — 線形MDPおよび線形混合MDPに対して、ほぼミニマックス最適なサンプル複雑度の限界を確立(COLT 2021、ICML 2021、ICML 2023)。RLアルゴリズムを厳密な理論的基盤に位置付けた。
- UCLA SuEIRモデル — CDCが死亡者数と入院者数の全国予測に使用したCOVID-19疫学モデル(2020年~2021年)。その結果は2つのPNAS論文に貢献(2022年、2023年)。
- EurekaClaw — 発案から証明、実験、論文生成に至るまでのパイプラインを自動化するローカルファーストのAI研究エージェント(eurekaclaw.ai)。AIが強化する科学的発見に関するGuの広範なビジョンを体現。
受賞歴・表彰
- WSDM Test of Time Paper Award(2024年) — 情報ネットワークと学習に関する初期の研究の長期的影響を認識。
- Alfred P. Sloan Research Fellowship(2022年) — Alfred P. Sloan財団より、機械学習とAIへの卓越した初期キャリア貢献に対して。
- JP Morgan Faculty Research Award(2022年) — 応用ML研究の影響に対する企業としての認識。
- AWS Machine Learning Research Award(2020年) — Amazon Web Servicesによる機械学習研究貢献の認識。
- IJCAI Early Career Talk(2020年) — 国際人工知能会議(IJCAI)での初期キャリア招待講演に選出。
- Simons Berkeley Research Fellowship(2019年) — サイモンズ計算理論研究所、深層学習の基礎サマープログラムでのフェローシップ。
- Adobe Data Science Research Award(2018年) および Salesforce Deep Learning Research Award(2018年) — 同年における2つの業界賞。
- NSF CAREER Award(2017年) — 米国国立科学財団の主要な初期キャリア賞。非凸統計的最適化に関する研究プログラムを支援。
- UVa SEAS Research Innovation Award(2017年) — バージニア大学工学部の研究革新賞。
- Yahoo! Academic Career Enhancement Award(2015年) — 教員キャリアの開始時に授与。
- IBM PhD Fellowship(2013年~2014年) — 博士研究を支援する競争的IBMフェローシップ。
- 清華大学優秀修士論文賞(2010年) — 優れた修士論文研究に対する学科としての認識。
- UIUCコンピュータサイエンス学科フェローシップ(2010年) — UIUCの博士課程への入学を支援するフェローシップ。
主要な関係
- Jiawei Han — UIUCでの博士指導教官。データマイニングにおいて最も影響力のある人物の一人であり、ネットワークからの知識発見に関する研究がGuの博士論文と初期の研究アジェンダを直接形成した。
- Zaixiang Zheng — ByteDance Seedでの主要な共同研究者。DPLM、DPLM-2、SeedProteoおよび関連するタンパク質モデリングシステムのプロジェクトリーダー。
- Xinyou Wang — DPLMおよびDPLM-2論文(ICML 2024、ICLR 2025)の主要な共著者。タンパク質言語モデルシリーズの構築において中心的な役割を果たす。
- Huizhuo Yuan — UCLA(MARS最適化器、SPPO)およびByteDanceの両方での頻繁な共著者。GuのLLMおよび最適化研究の流れにおける重要人物。
- Dongruo Zhou — 強化学習理論(複数のICMLおよびNeurIPS論文)と非凸最適化に関する多作な共著者。現在は独立した研究者。
- Difan Zou — 過剰パラメータモデルにおけるSGDの暗黙的正則化と良性過学習を分析した一連の影響力のある論文の共著者。
- Zixiang Chen — 深層学習理論およびSelf-Play Fine-Tuningの研究ライン(SPIN, ICML 2024)の共著者。
人物像
Guは、学界で高アウトプットで厳密な理論研究を続けながら、同時に産業AIの最前線で応用エンジニアリングを推進するという、通常はトレードオフを必要とする運営スタイルを拒否しているように見える点で、ML研究者の中でも異色である。両方の場での彼の研究スタイルは、実用的に動機付けられた設定においてさえ、ヒューリスティックな性能向上よりもミニマックス最適な統計的保証を好むことを特徴とする。公の場では、AIは研究のための単なるツールではなく、研究パイプラインそのものを積極的に再構築しているという見解を声高に主張してきた。彼のEurekaClawプロジェクトやX上のコメントは、人間、モデル、ツールが共進化する「システムレベルの発見」がすでに進行中であるという確信を反映している。短い署名「最高のモデルはまだこれからだ。スケーリングは続く」を残してByteDanceを去ったことは、回顧ではなく意図の表明として広く受け止められた。
参考文献
- 個人ウェブサイト: web.cs.ucla.edu/~qgu
- UCLA Samueli工学部教員ページ: samueli.ucla.edu/people/quanquan-gu
- UCLA Artificial General Intelligence Lab: uclaml.org
- CV(PDF): web.cs.ucla.edu/~qgu/pdf/CV.pdf
- Google Scholar: scholar.google.com/citations?user=GU9HgNAAAAAJ
- OpenReviewの経歴: openreview.net/profile?id=~Quanquan_Gu1
- UIUC IDEALSの学位論文: ideals.illinois.edu/items/50868
- SeedFoldプロジェクトページ: seedfold.github.io
- DPLM GitHubリポジトリ: github.com/bytedance/dplm
- サウスチャイナ・モーニング・ポスト、離任報道(2026年6月2日): scmp.com/tech/big-tech/article/3355677