Yejin Choi

Koreanisch-amerikanische NLP-Forscherin und MacArthur-Stipendiatin, deren Karriere den Bogen spannt von Meinungsanalyse und Bildbeschriftung über Wissensbasen des gesunden Menschenverstands und moralische KI bis hin zur These, Skalierungsgesetze mit intelligenteren Algorithmen zu überwinden – heute ist sie als Dieter-Schwarz-Stiftungsprofessorin an der Stanford University tätig.


Profil

Geboren 1977, Südkorea
Nationalität Koreanisch-amerikanisch
Derzeitige Institution(en) Stanford University – Dieter-Schwarz-Stiftungsprofessorin und Senior Fellow, Informatik und HAI (2025–heute)
Forschungsbereiche Natürliche Sprachverarbeitung, Common-Sense-KI, moralische KI, neuro-symbolische KI, pluralistische Ausrichtung, KI für die Wissenschaft, Grundlagen von Sprachmodellen
Doktorvater/-mutter Claire Cardie
Dissertation Fine-Grained Opinion Analysis: Structure-Aware Approaches (Cornell University, 2010)
Webseite yejinc.github.io
X / Twitter @YejinChoinka
GitHub yejinc
Google Scholar Yejin Choi

Überblick

Yejin Choi (koreanisch: 최예진) ist eine koreanisch-amerikanische NLP-Forscherin und MacArthur-Stipendiatin des Jahres 2022. Sie ist heute Dieter-Schwarz-Stiftungsprofessorin an der Stanford University und Senior Fellow am Stanford Institute for Human-Centered Artificial Intelligence (HAI). Ihre Karriere ist ungewöhnlich breit gefächert: Sie bewegte sich von der Meinungs- und Sentimentanalyse (ihre Doktorarbeit an der Cornell University) über Bildbeschriftung und visuelle Sprache (ausgezeichnet mit dem CVPR Longuet-Higgins-Preis und dem ICCV Marr-Preis) zu Common-Sense-Schlussfolgerungen und Wissensdatenbanken (ATOMIC, COMET, Winogrande, an der University of Washington und am Allen Institute for AI), zu moralischen KI-Systemen (Delphi), zur Erforschung der Grenzen und Fehler großer Sprachmodelle, zu KI für die Wissenschaft bei NVIDIA und schließlich zur pluralistischen Ausrichtung und der These, dass „intelligentere Algorithmen“ Skalierungsgesetze überwinden können. Sie hat in mehr als fünfzehn wichtigen Konferenzorten in den Bereichen NLP, Computer Vision und ML Best- oder Outstanding-Paper-Auszeichnungen erhalten, einen TED-Vortrag gehalten, der millionenfach gesehen wurde, im September 2025 den UN-Sicherheitsrat über KI-Sicherheit informiert, und wurde sowohl 2023 als auch 2025 in die TIME100 AI aufgenommen. Die Breite ihrer Arbeit wird durch ihr öffentliches Profil ergänzt: Keine aktive NPL-Forscherin hat die Kluft zwischen den scheinbaren Fähigkeiten der KI und ihren zugrundeliegenden Einschränkungen – was sie als „unglaublich klug und erschreckend dumm“ bezeichnet – einem breiten Mainstream-Publikum so vermittelt wie sie.


Frühes Leben und Ausbildung

Choi wurde 1977 in Südkorea geboren. Sie absolvierte einen Bachelor-Abschluss in Informatik an der Seoul National University, bevor sie für ihr Graduiertenstudium in die Vereinigten Staaten ging. An der Cornell University arbeitete sie mit Claire Cardie auf dem Gebiet der natürlichen Sprachverarbeitung und schloss ihre Promotion 2010 mit einer Dissertation mit dem Titel Fine-Grained Opinion Analysis: Structure-Aware Approaches ab. In der Dissertation wurden strukturierte probabilistische Modelle zur Identifizierung von Meinungsträgern, -zielen und Sentiment-Polarität in Texten entwickelt – ein früher Beitrag zu dem, was später als aspektbasierte Sentimentanalyse bekannt wurde. Ihre Arbeit zur Identifizierung betrügerischer Meinungen (einschließlich der Erkennung gefälschter Hotelbewertungen, veröffentlicht auf der ACL 2011 mit Myle Ott, Claire Cardie und Jeffrey Hancock) wurde mit dem ACL 2021 Test of Time Award ausgezeichnet, der sie als grundlegendes Ergebnis der computergestützten Täuschungserkennung würdigt.


Karriere

Stony Brook University – Assistenzprofessorin (2010–2013)

Nach ihrer Promotion wechselte Choi als Assistenzprofessorin an die Fakultät für Informatik der Stony Brook University. In dieser Zeit erweiterte sie ihre NLP-Arbeit um die Verankerung visueller Sprache. Ihr BabyTalk-Projekt – die automatische Generierung natürlicher Sprachbeschreibungen von Bildern – war eine frühe Demonstration automatischer Bildbeschriftung und wurde im IEEE TPAMI veröffentlicht. Arbeiten aus dieser Zeit wurden mit dem CVPR 2021 Longuet-Higgins Prize (für ihren nachhaltigen Einfluss auf das Fachgebiet) und dem ICCV 2013 Marr Prize (bester Paper) ausgezeichnet, letzterer für die Arbeit zum Erlernen von Alltagskategorien aus großen Bilddatenmengen mit der Gruppe von Alexander Berg.

University of Washington – Professorin (2013–2024)

Choi wechselte an die Paul G. Allen School of Computer Science & Engineering der University of Washington, wo sie über ein Jahrzehnt als eine der prominentesten NLP-Forscherinnen tätig war. Sie hatte die Brett-Helsel-Career-Development-Professur (2020–2023) und den Wissner-Slivka-Lehrstuhl (2023–2024) inne. In dieser Zeit leitete sie gemeinsam die Mosaic-Gruppe am Allen Institute for AI (AI2), die an der UW mit AI2-Forschern eingebettet war.

Common-Sense-KI: ATOMIC und COMET. Das nachhaltigste intellektuelle Engagement von Chois UW-Jahren war die Frage, ob KI-Systeme Common-Sense-Wissen erwerben und damit schlussfolgern könnten – das implizite Verständnis alltäglicher Ereignisse, Kausalitäten und sozialer Normen, das Menschen für selbstverständlich halten, das NLP-Systemen aber durchweg fehlte. Sie erstellte ATOMIC (Atlas of Machine Commonsense), einen Wissensgraphen mit über 300.000 Wenn-Dann-Inferenzbeziehungen, die Ursachen, Wirkungen, Absichten und Reaktionen alltäglicher Ereignisse abdecken (veröffentlicht auf der AAAI 2019, Outstanding Paper Award 2020). ATOMIC wurde zur größten offenen Common-Sense-Wissensdatenbank ihrer Art. Darauf aufbauend entwickelte sie COMET (Commonsense Transformers) und zeigte, dass auf ATOMIC feinabgestimmte große Sprachmodelle neue Common-Sense-Schlussfolgerungen in natürlicher Sprache generieren konnten – eine frühe Demonstration von LLMs als implizite Systeme zur Vervollständigung von Wissensdatenbanken. Das Programm wurde vom Quanta Magazine („Common Sense Comes to Computers“) und von Axios behandelt.

Winogrande. Choi leitete die Erstellung von Winogrande, einem großen Crowdsourcing-Datensatz für die Winograd-Schema-Herausforderung – eine Klasse von Pronomen-Disambiguierungsaufgaben, die speziell darauf ausgelegt sind, Common-Sense-Schlussfolgerungen zu erfordern. Winogrande (NeurIPS 2020) verwendete einen adversariellen Filteralgorithmus, um Datenartefakte zu entfernen, die es Modellen ermöglichen, zu schummeln, und schuf so einen wesentlich schwierigeren Benchmark als frühere Versionen. Der Datensatz wurde zu einem Standard-Evaluierungsinstrument für Common-Sense-Schlussfolgerungen in Sprachmodellen.

Delphi und moralische KI. Chois Gruppe entwickelte Delphi, ein rechnergestütztes Modell moralischer Urteile (2021), und den dazugehörigen Commonsense Norm Bank-Datensatz. Delphi war einer der ersten groß angelegten Versuche, ein Modell auf explizite moralische Intuitionen in verschiedenen sozialen Situationen zu trainieren und menschenlesbare moralische Bewertungen zu generieren. Das Projekt wurde von der New York Times vorgestellt („Can a Machine Learn Morality?“) und löste eine anhaltende öffentliche Diskussion über die Rolle der KI bei ethischen Entscheidungen aus. Choi hat eine differenzierte Position beibehalten: Delphi wurde als Forschungswerkzeug zum Verständnis normativen Denkens in Sprachmodellen entwickelt, nicht als Vorschrift, wie KI moralische Entscheidungen treffen sollte.

Alexa-Preis. Das von Choi geleitete UW-Team (das Sounding-Board-Projekt) gewann den ersten Amazon Alexa-Preis für die Entwicklung der ansprechendsten Open-Domain-Konversations-KI unter den Universitätsteams.

KI-Einschränkungen und „erschreckend dumme“ KI. Parallel zu ihrer konstruktiven Common-Sense-Arbeit entwickelte Choi eine öffentliche intellektuelle Stimme bezüglich der Kluft zwischen den oberflächlichen Fähigkeiten großer Sprachmodelle und ihrem zugrundeliegenden Verständnis. Ihr TED-Vortrag von 2023, „Why AI is Incredibly Smart — and Shockingly Stupid“, wurde vielfach gesehen und gehört zu den am meisten geteilten akademischen Beiträgen zum öffentlichen Verständnis von LLM-Einschränkungen.

Allen Institute for AI (AI2) – Senior Research Manager, Mosaic Group (2018–2024)

2018 wechselte Choi als Senior Researcher an der UW eingebettet zu AI2 und leitete die Mosaic-Gruppe – das Common-Sense-KI-Forschungsprogramm, das ATOMIC, COMET, Winogrande und verwandte Wissens- und Inferenzressourcen hervorbrachte. Sie behielt während ihrer gesamten UW-Zeit eine gemeinsame Berufung dort bei.

NVIDIA – Distinguished Scientist (2024–2025)

Bevor sie zu Stanford wechselte, hatte Choi eine Distinguished-Scientist-Position bei NVIDIA inne, wo sich ihre Arbeit auf KI für die Wissenschaft ausweitete – molekulare Foundation-Modelle, Proteinlogik, Kristallstrukturvorhersage – und zur Nemotron-Modellfamilie beitrug. Sie entwickelte auch Arbeiten zur Überwindung von Skalierungsgesetzen mit „intelligenteren Algorithmen“: die These, dass Fortschritte im Algorithmendesign, in den Trainingsstrategien und der Datenkuratierung (anstelle von rohem Rechenskalieren) qualitative Verbesserungen der Fähigkeiten kleiner und mittlerer Modelle freisetzen können. Zu den Arbeiten aus dieser Zeit gehören Veröffentlichungen zu verlängertem Reinforcement Learning, Training während des Testens und neuen Tokenisierungsansätzen.

Stanford University (2025–heute)

2025 gab Stanford HAI die Berufung von Choi zur Dieter-Schwarz-Stiftungsprofessorin für Informatik und Senior Fellow am HAI bekannt. Ihre Forschungsinteressen in Stanford umfassen KI für die Wissenschaft (Molekül- und Proteindenken), pluralistische Ausrichtung und Werte in der KI, alternative Trainings- und Inferenzalgorithmen sowie die Untersuchung von LLM-Einschränkungen. Im September 2025 informierte sie den UN-Sicherheitsrat über KI-Sicherheit, eine der prominentesten öffentlich-politischen Einladungen, die je ein KI-Forscher erhalten hat.


Hauptbeiträge

  • Erkennung gefälschter Bewertungen (ACL 2011; ACL 2021 Test of Time Award) – „Finding Deceptive Opinion Spam by Any Stretch of the Imagination“, mit Myle Ott, Claire Cardie und Jeffrey Hancock. Führte die erste groß angelegte Studie zur Erzeugung und Erkennung betrügerischer Meinungen ein und zeigte, dass maschinelles Lernen gefälschte Hotelbewertungen mit einer über dem Zufall liegenden Genauigkeit identifizieren konnte. Erhielt ein Jahrzehnt später den ACL Test of Time Award für grundlegende Auswirkungen auf die computergestützte Glaubwürdigkeitsforschung.

  • BabyTalk / Bildbeschriftung (CVPR Longuet-Higgins Prize 2021) – „BabyTalk: Understanding and Generating Simple Image Descriptions“, TPAMI 2013, mit Girish Kulkarni, Vicente Ordonez und der Berg-Gruppe. Eines der frühesten automatischen Systeme zur Beschreibung von Bildern in natürlicher Sprache, das nachträglich als grundlegender Beitrag zur Vision-Language-Grounding-Forschung ausgezeichnet wurde.

  • Alltagskategorien (ICCV 2013 Marr Prize) – Arbeit zum Erlernen der Abstraktionsebene, auf der Menschen natürlicherweise Objekte in Bildern benennen, die den Best-Paper-Preis auf der ICCV 2013 gewann.

  • ATOMIC (AAAI 2019; AAAI 2020 Outstanding Paper) – Atlas of Machine Commonsense: ein Wissensgraph mit über 300.000 Wenn-Dann-Inferenzregeln, die Ursachen, Wirkungen, Absichten und Reaktionen alltäglicher Ereignisse abdecken. Die größte offene Common-Sense-Wissensdatenbank ihrer Zeit, die die Grundlage für COMET und mehrere Generationen von Common-Sense-Inferenzsystemen bildete.

  • COMET (ACL 2019) – Commonsense Transformers: feinabgestimmte Sprachmodelle, die neue Common-Sense-Schlussfolgerungen aus ATOMIC generieren und LLMs als generative Systeme zur Vervollständigung von Wissensdatenbanken und als Common-Sense-Inferenzmaschinen demonstrieren.

  • Winogrande (NeurIPS 2020) – Ein großer adversariell gefilterter Crowdsourcing-Datensatz für Common-Sense-Schlussfolgerungen im Winograd-Schema, wesentlich schwieriger als frühere Versionen und weithin als Standard-Benchmark für die Messung des Common-Sense-Verständnisses in Sprachmodellen übernommen.

  • Delphi (2021) – Ein rechnergestütztes Modell des moralischen Urteils, das auf dem Commonsense Norm Bank-Datensatz trainiert wurde, einer der ersten Versuche, ein Sprachmodell zu schaffen, das in verschiedenen sozialen Situationen menschenlesbare moralische Bewertungen erzeugt. Vorgestellt in der New York Times und trug zur breiteren öffentlichen Debatte über KI und Ethik bei.

  • Pluralistische Ausrichtung und Überwindung von Skalierungsgesetzen – Eine nachhaltige Forschungsagenda (2023–heute), die argumentiert, dass verschiedene menschliche Werte und Perspektiven explizit im KI-Training repräsentiert werden müssen, anstatt weggemittelt zu werden, kombiniert mit einem technischen Programm, das demonstriert, dass intelligentes Algorithmendesign Fähigkeitsverbesserungen erreichen kann, ohne einfach die Rechenleistung zu skalieren.


Auszeichnungen und Ehrungen

  • MacArthur Fellowship (2022) – Das „Genie-Stipendium“ der MacArthur Foundation, verliehen für außergewöhnliche Kreativität und Potenzial.
  • ACL Fellow (2022) – Fellow der Association for Computational Linguistics.
  • TIME100 AI (2025 und 2023) – In beiden Jahren in die Liste der 100 einflussreichsten Menschen im Bereich KI des Time-Magazins aufgenommen.
  • AI2050 Senior Fellow (2024) – Ernannt vom AI2050-Programm von Schmidt Sciences.
  • Briefing vor dem UN-Sicherheitsrat (September 2025) – Informierte den UN-Sicherheitsrat über KI-Sicherheit.
  • Best-/Outstanding-Paper-Auszeichnungen – Auf der NeurIPS 2025 (zwei Auszeichnungen), EMNLP 2025 (zwei Auszeichnungen), ACL 2025 (zwei Auszeichnungen), EMNLP 2023, ACL 2023 (zwei Auszeichnungen), NAACL 2022, ICML 2022, NeurIPS 2021, AAAI 2020.
  • CVPR Longuet-Higgins Prize (2021) – Für die BabyTalk-Bildbeschriftungsarbeit.
  • ACL Test of Time Award (2021) – Für das Paper zur Erkennung gefälschter Bewertungen.
  • ICCV 2013 Marr Prize – Best-Paper-Auszeichnung auf der International Conference on Computer Vision.
  • Anita Borg Early Career Award (BECA, 2018) – CRA-WP-Auszeichnung für herausragende Frauen in der Informatik zu Beginn ihrer Karriere.
  • IEEE AI’s 10 to Watch (2016) – Von der IEEE zu den zehn einflussreichsten KI-Forschern zu Beginn ihrer Karriere ernannt.
  • Gewinner des Alexa-Preises – Das Sounding-Board-Team der University of Washington (unter der Leitung von Choi) gewann den ersten Amazon Alexa-Preis.

Wichtige Beziehungen

  • Claire Cardie – Doktorvater/-mutter an der Cornell University; eine führende Forscherin in der Informationsextraktion und Meinungsanalyse, die Chois grundlegende NLP-Ausrichtung geprägt hat.
  • Hannaneh Hajishirzi – Langjährige Kollegin an der University of Washington; häufige Koautorin bei Arbeiten zu den Grundlagen von Sprachmodellen, offenen Modellen (OLMo, OLMoTrace) und Leseverständnis.
  • Luke Zettlemoyer – Kollege an der University of Washington; Koautor bei mehreren NLP-Benchmarks, Sprachmodellanalysen und Grounding-Forschung.
  • Maarten Sap – Doktorand, der ATOMIC, COMET und mehrere Arbeiten zu Moral/Common-Sense-KI mitverfasst hat; heute Assistenzprofessor an der CMU.
  • Ronan Le Bras – Langjähriger Mitarbeiter bei AI2 an Common-Sense-Ressourcen und Inferenz-Benchmarks.
  • Liwei Jiang – Doktorandin an der UW/Stanford, die an pluralistischer Ausrichtung, Werten in der KI und normativem Denken arbeitet.
  • Ximing Lu – Enge Mitarbeiterin und Forscherin auf den Gebieten Denken, RLVR und Modelltraining; taucht in Dutzenden aktueller Papers auf.
  • Noah A. Smith – UW-Professor und häufiger Mitarbeiter bei der Evaluierung von Sprachmodellen, Daten und NLP-Grundlagen.

Persönlicher Stil

Choi ist eine der öffentlichkeitswirksamsten akademischen KI-Forscherinnen ihrer Generation – nicht in erster Linie über soziale Medien, sondern durch eine konsequente Bemühung, die nuancierte Realität der KI-Fähigkeiten einem nicht-fachkundigen Publikum zu vermitteln. Ihre TED-Talks, das New-Yorker-Porträt, die Quanta-Magazine-Berichterstattung, ihr Auftritt in „This American Life“ und der Bill-Gates-Podcast haben insgesamt ein Publikum in zweistelliger Millionenhöhe erreicht, und sie geht diese Gelegenheiten mit der gleichen intellektuellen Präzision an, die sie in ihre technische Arbeit einbringt: Sie widersteht sowohl KI-Hype als auch KI-Abwertung, um stattdessen eine präzise Formulierung dessen zu liefern, was aktuelle Systeme können und was nicht. Ihre Forschungsagenda ist in ihrem Umfang charakteristisch ehrgeizig – Common-Sense-KI, moralisches Denken, pluralistische Ausrichtung und KI für die Wissenschaft sind jeweils groß genug, um ein ganzes Forschungsprogramm zu verankern, und sie verfolgt sie alle gleichzeitig. Sie hat über die Bedeutung von Repräsentation in der KI gesprochen, über Verzerrungen in Sprach- und Bildsystemen, die unterrepräsentierte Gruppen benachteiligen, und über die Pflicht von KI-Forschern, sich am öffentlichen politischen Diskurs zu beteiligen. Ihr Briefing vor dem UN-Sicherheitsrat im September 2025 stellt die direkteste Schnittstelle ihrer Forschung mit der internationalen Governance der Technologie dar, die sie untersucht.


Referenzen