韓国系アメリカ人のNLP研究者であり、マッカーサー・フェロー。そのキャリアは、意見分析や画像キャプショニングから、常識知識ベース、道徳推論AI、そしてスケーリング則をよりスマートなアルゴリズムで活用するという主張へと展開している。現在はスタンフォード大学でDieter Schwarz Foundation Professorを務める。
プロフィール
| 生誕 | 1977年、韓国 |
| 国籍 | 韓国系アメリカ人 |
| 現在の所属 | スタンフォード大学 — Dieter Schwarz Foundation Professor & Senior Fellow, Computer Science and HAI(2025–現在) |
| 研究領域 | 自然言語処理、常識AI、道徳推論、ニューロシンボリックAI、多元的アライメント、科学のためのAI、言語モデル基盤 |
| 博士課程指導教官 | Claire Cardie |
| 博士論文 | 「きめ細かい意見分析:構造を考慮したアプローチ」(コーネル大学、2010年) |
| ウェブサイト | yejinc.github.io |
| X / Twitter | @YejinChoinka |
| GitHub | yejinc |
| Google Scholar | Yejin Choi |
概要
Yejin Choi(韓国語:최예진)は、韓国系アメリカ人のNLP研究者であり、2022年のマッカーサー・フェロー。現在はスタンフォード大学のDieter Schwarz Foundation Professor、およびスタンフォード・ヒューマン・センタード・AI研究所(HAI)のSenior Fellowを務めている。そのキャリアは異例なほど広範で、コーネル大学での博士研究である意見分析や感情分析から、画像キャプショニングと視覚言語(CVPR Longuet-Higgins Prize、ICCV Marr Prize受賞)、ワシントン大学とアレンAI研究所での常識推論と知識ベース(ATOMIC、COMET、Winogrande)、道徳AIシステム(Delphi)、大規模言語モデルの限界と失敗に関する研究、NVIDIAでの科学のためのAI、そして最近では多元的アライメントと「より賢いアルゴリズム」がスケーリング則を超越できるという主張へと移行している。NLP、ビジョン、MLの主要な会議で15以上の最優秀論文賞または優秀論文賞を受賞し、何百万人もの視聴者を持つTEDトークを行い、2025年9月には国連安全保障理事会でAIの安全性についてブリーフィングを行い、2023年と2025年の両方でTIME100 AIに選出されている。その研究の広がりは、彼女の公的な知名度に見合うものである。AIの見かけ上の能力と根底にある限界の間のギャップ(彼女が「信じられないほど賢く、衝撃的に愚か」と呼ぶもの)を、より広い一般の聴衆に伝えることに成功した現役のNLP研究者は他にいない。
生い立ちと教育
Choiは1977年に韓国で生まれた。ソウル大学でコンピューターサイエンスの学士号を取得した後、大学院に進学するために渡米した。コーネル大学ではClaire Cardieのもとで自然言語処理を学び、2010年に博士号を取得。博士論文のタイトルは 「きめ細かい意見分析:構造を考慮したアプローチ」 である。この論文は、テキスト中の意見の持ち主、対象、感情極性を特定するための構造化確率モデルを開発したもので、アスペクトベース感情分析の分野への初期の貢献となった。偽のホテルレビューの検出を含む、欺瞞的な意見の特定に関する研究(Myle Ott、Claire Cardie、Jeffrey Hancockとの共著、ACL 2011)は、ACL 2021 Test of Time Awardを受賞し、計算論的欺瞞検出における基礎的成果として認められた。
キャリア
ストーニーブルック大学 — 准教授(2010–2013年)
博士号取得後、Choiはストーニーブルック大学のコンピューターサイエンス学科に准教授として着任した。この期間に、彼女はNLPの研究を視覚言語の接地に拡張した。彼女のBabyTalkプロジェクト(画像の自然言語による説明を生成する)は、自動画像キャプショニングの初期のデモンストレーションであり、IEEE TPAMIに掲載された。この時期の研究は、CVPR 2021 Longuet-Higgins Prize(分野への永続的な影響に対して)とICCV 2013 Marr Prize(最優秀論文賞)を受賞しており、後者はAlexander Bergのグループと大規模画像データセットから基本カテゴリを学習する研究に対してである。
ワシントン大学 — 教授(2013–2024年)
Choiはワシントン大学ポール・G・アレン・コンピューターサイエンス&エンジニアリング学部に加わり、10年以上にわたって最も著名なNLP研究者の一人として活躍した。Brett Helsel Career Development Professor(2020–2023年)およびWissner-Slivka Chair(2023–2024年)を歴任。この間、アレンAI研究所(AI2)のMosaicグループを共同で率い、UW内に拠点を置きながらAI2の研究者と連携した。
常識AI:ATOMICとCOMET。 Choiのワシントン大学時代における最も持続的な知的コミットメントは、AIシステムが常識知識(人間が当然のことと考えている日常的な出来事、因果関係、社会的規範についての暗黙の理解であり、NLPシステムが一貫して欠いているもの)を獲得し、それを使って推論できるかどうかという問題であった。彼女はATOMIC(Atlas of Machine Commonsense)を構築した。これは、日常的な出来事の原因、結果、意図、反応をカバーする30万以上のif-then推論関係からなる知識グラフである(AAAI 2019発表、2020年優秀論文賞)。ATOMICは、同種のオープンな常識知識ベースとしては最大のものとなった。これに基づいて、彼女はCOMET(Commonsense Transformers)を開発した。これはATOMICでファインチューニングされた大規模言語モデルが、自然言語で新しい常識推論を生成できることを示したもので、LLMを暗黙の知識ベース補完システムとして実証した初期の研究である。このプログラムはQuanta Magazine(「コンピューターに常識が訪れる」)やAxiosで取り上げられた。
Winogrande。 ChoiはWinograndeの構築を主導した。これはWinogradスキーマチャレンジ(常識推論を必要とするように特別に設計された代名詞曖昧性解消問題の一種)のための大規模クラウドソーシングデータセットである。Winogrande(NeurIPS 2020)は、モデルが不正に解答できるようにするデータアーティファクトを除去するために敵対的フィルタリングアルゴリズムを使用し、以前のバージョンよりもはるかに難しいベンチマークを作成した。このデータセットは、言語モデルにおける常識推論の標準的な評価指標となった。
Delphiと道徳AI。 Choiのグループは、道徳的判断の計算モデルであるDelphi(2021年)と、関連するCommonsense Norm Bankデータセットを開発した。Delphiは、多様な社会的状況にわたる明示的な道徳的直感に基づいてモデルを訓練し、人間が読める形の道徳的評価を生成する、初めての大規模な試みの一つであった。このプロジェクトはニューヨーク・タイムズで取り上げられ(「機械は道徳を学べるか?」)、AIの倫理的意志決定における役割について持続的な公開討論を引き起こした。Choiは微妙な立場を維持している。Delphiは、言語モデルにおける規範的推論を理解するための研究ツールとして設計されたものであり、AIがどのように道徳的判断を下すべきかについての処方箋ではない。
Alexa Prize。 Choiが率いるUWチーム(Sounding Boardプロジェクト)は、大学チームの中で最も魅力的なオープンドメインの対話型AIを開発したとして、初のAlexa Prizeを獲得した。
AIの限界と「衝撃的に愚かな」AI。 建設的な常識研究と並行して、Choiは大規模言語モデルの表面的な能力と根底にある理解との間のギャップに関して、公的な知的発言力を培った。彼女の2023年のTEDトーク「なぜAIは信じられないほど賢く、衝撃的に愚かなのか」は広く視聴され、LLMの限界についての一般の理解に対する学術的貢献として最も共有されたものの一つである。
アレンAI研究所(AI2) — シニアリサーチマネージャー、Mosaicグループ(2018–2024年)
2018年、ChoiはAI2にシニアリサーチャーとして参加し、UWに拠点を置きながら、ATOMIC、COMET、Winogrande、および関連する知識・推論リソースを生み出した常識AI研究プログラムであるMosaicグループを共同で率いた。彼女はワシントン大学在籍中、この非常勤のポストを維持した。
NVIDIA — ディスティングイッシュトサイエンティスト(2024–2025年)
スタンフォードに移る前、ChoiはNVIDIAでディスティングイッシュトサイエンティストを務め、その研究は科学のためのAI(分子基盤モデル、タンパク質推論、結晶構造予測)に拡大し、Nemotronモデルファミリーに貢献した。また、「より賢いアルゴリズム」でスケーリング則を活用する研究を発展させた。これは、アルゴリズム設計、訓練戦略、データキュレーションの進歩が(生の計算スケーリングではなく)小規模および中規模モデルで質的な能力向上を解き放つことができるという主張である。この時期の論文には、長期強化学習、テスト時訓練、新しいトークン化アプローチに関する研究が含まれる。
スタンフォード大学(2025年–現在)
2025年、スタンフォードHAIは、ChoiをDieter Schwarz Foundation Professor of Computer ScienceおよびHAIのSenior Fellowに任命することを発表した。スタンフォードでの彼女の研究興味は、科学のためのAI(分子およびタンパク質推論)、AIにおける多元的アライメントと価値観、代替的な訓練・推論アルゴリズム、そしてLLMの限界の研究に及ぶ。2025年9月、彼女は国連安全保障理事会でAIの安全性についてブリーフィングを行った。これは、AI研究者が受けた最も著名な公共政策への招待の一つである。
主な貢献
-
偽レビュー検出(ACL 2011; ACL 2021 Test of Time Award) —「想像力を駆使して欺瞞的な意見スパムを見つける」、Myle Ott、Claire Cardie、Jeffrey Hancockとの共著。欺瞞的な意見の生成と検出に関する最初の大規模研究を紹介し、機械学習が偽のホテルレビューを偶然以上の精度で識別できることを実証。10年後に計算論的信頼性研究への基礎的影響に対してACL Test of Time Awardを受賞。
-
BabyTalk / 画像キャプショニング(CVPR Longuet-Higgins Prize 2021) —「BabyTalk:単純な画像記述の理解と生成」、TPAMI 2013、Girish Kulkarni、Vicente Ordonez、Bergグループとの共著。画像に対する最も初期の自動自然言語記述システムの一つであり、視覚言語接地基盤への基礎的貢献として事後的に認められた。
-
基本カテゴリ(ICCV 2013 Marr Prize) — 人間が画像内のオブジェクトを自然に命名する抽象化のレベルを学習する研究で、ICCV 2013の最優秀論文賞を受賞。
-
ATOMIC(AAAI 2019; AAAI 2020 優秀論文賞) — 機械常識のアトラス:日常的な出来事の原因、結果、意図、反応をカバーする30万以上のif-then推論ルールからなる知識グラフ。当時最大のオープン常識知識ベースであり、COMETと複数世代の常識推論システムの基礎を形成。
-
COMET(ACL 2019) — 常識トランスフォーマー:ATOMICでファインチューニングされた言語モデルが新しい常識推論を生成し、LLMを生成的知識ベース補完システムおよび常識推論エンジンとして実証。
-
Winogrande(NeurIPS 2020) — Winogradスキーマ常識推論のための大規模敵対的フィルタリング済みクラウドソーシングデータセット。以前のバージョンよりもはるかに難しく、言語モデルの常識理解を測定するための標準ベンチマークとして広く採用されている。
-
Delphi(2021) — Commonsense Norm Bankデータセットで訓練された道徳的判断の計算モデル。多様な社会的状況にわたって人間が読める形の道徳的評価を生成する言語モデルを作成する初期の試みの一つ。ニューヨーク・タイムズで取り上げられ、AIと倫理に関するより広範な公開討論に貢献。
-
多元的アライメントとスケーリング則の活用 — 持続的な研究課題(2023年–現在)。多様な人間の価値観と視点を平均化するのではなく、AI訓練に明示的に表現する必要があると主張し、さらに、賢いアルゴリズム設計が単に計算をスケーリングするだけなく能力向上を達成できることを実証する技術的プログラムを組み合わせている。
受賞および栄誉
- マッカーサー・フェローシップ(2022年) — マッカーサー財団による「天才賞」。並外れた創造性と可能性に対して授与。
- ACLフェロー(2022年) — 計算言語学協会フェロー。
- TIME100 AI(2025年、2023年) — タイム誌の「AIで最も影響力のある100人」に両年選出。
- AI2050 シニアフェロー(2024年) — Schmidt SciencesのAI2050プログラムに選出。
- 国連安全保障理事会ブリーフィング(2025年9月) — 国連安全保障理事会でAIの安全性についてブリーフィング。
- 最優秀論文賞/優秀論文賞 — NeurIPS 2025(2件)、EMNLP 2025(2件)、ACL 2025(2件)、EMNLP 2023、ACL 2023(2件)、NAACL 2022、ICML 2022、NeurIPS 2021、AAAI 2020。
- CVPR Longuet-Higgins Prize(2021年) — BabyTalk画像キャプショニング研究に対して。
- ACL Test of Time Award(2021年) — 偽レビュー検出論文に対して。
- ICCV 2013 Marr Prize — 国際コンピュータビジョン会議における最優秀論文賞。
- Anita Borg Early Career Award(BECA、2018年) — CRA-WP賞。優れた初期キャリアの女性コンピュータ科学者に対して。
- IEEE AI’s 10 to Watch(2016年) — IEEEにより、最も影響力のある初期キャリアのAI研究者10人に選出。
- Alexa Prize受賞 — ワシントン大学のSounding Boardチーム(Choiが率いた)が初のAlexa Prizeを獲得。
主な関係者
- Claire Cardie — コーネル大学での博士課程指導教官。情報抽出と意見分析の第一人者であり、ChoiのNLPの基本的な方向性を形成。
- Hannaneh Hajishirzi — ワシントン大学での長年の同僚。言語モデル基盤、オープンモデル(OLMo、OLMoTrace)、読解に関する頻繁な共著者。
- Luke Zettlemoyer — ワシントン大学の同僚。複数のNLPベンチマーク、言語モデル分析、接地研究で共著。
- Maarten Sap — ATOMIC、COMET、および複数の道徳/常識AI論文を共著した博士課程学生。現在はカーネギーメロン大学の助教授。
- Ronan Le Bras — AI2での常識リソースと推論ベンチマークに関する長年の協力者。
- Liwei Jiang — ワシントン大学/スタンフォード大学の博士課程学生。多元的アライメント、AIにおける価値観、規範的推論に取り組む。
- Ximing Lu — 緊密な協力者であり、推論、RLVR、モデル訓練の研究者。近年の多くの論文に登場。
- Noah A. Smith — ワシントン大学の教授であり、言語モデル評価、データ、NLP基盤に関する頻繁な協力者。
個人的スタイル
Choiは、自身の世代で最も公的な顔を持つアカデミックAI研究者の一人である。それは主にソーシャルメディアを通じてではなく、AI能力の微妙な現実を専門家以外の聴衆に伝えるための一貫した努力を通じてである。彼女のTEDトーク、ニューヨーカーのプロフィール、Quanta Magazineの記事、ディス・アメリカン・ライフへの出演、ビル・ゲイツのポッドキャストは、合わせて数千万人の聴衆にリーチしており、彼女はこれらの機会に、技術的な仕事と同じ知的精度で臨んでいる。AIの誇大広告とAIへの否定的な見解の両方に抵抗し、現在のシステムが何をできて何ができないかを正確に表現することを重視する。彼女の研究課題は、その範囲において特徴的に野心的である。常識AI、道徳推論、多元的アライメント、科学のためのAIは、それぞれが単独で研究プログラム全体を支えるに足る大きさであり、彼女はそれらすべてを同時に追求している。彼女はAIにおける代表性の重要性、過小評価されたグループにとって不利な言語およびビジョンシステムにおけるバイアス、そしてAI研究者が公共政策の議論に参加する義務について語ってきた。2025年9月の国連安全保障理事会でのブリーフィングは、彼女の研究と、彼女が研究するテクノロジーの国際的なガバナンスとの最も直接的な交差点である。
参考文献
- 個人ウェブサイト: yejinc.github.io
- スタンフォードHAIプロフィール: hai.stanford.edu
- Wikipedia: Yejin Choi
- Google Scholar: scholar.google.com
- マッカーサー財団: macfound.org
- TEDトーク(2023年): ted.com
- ニューヨーカープロフィール: newyorker.com
- TIME100 AI 2025: time.com
- 国連安全保障理事会ブリーフィング: hai.stanford.edu
- Diggプロフィール: digg.com/u/x/yejinchoinka