Chercheuse coréo-américaine en TALN et boursière MacArthur dont la carrière a suivi l’arc allant de l’analyse d’opinion et du sous-titrage d’images aux bases de connaissances de bon sens, à l’IA de raisonnement moral et à la thèse du contournement des lois de l’échelle grâce à des algorithmes plus intelligents — aujourd’hui à Stanford en tant que professeure titulaire de la chaire Dieter Schwarz.
Profil
| Née | 1977, Corée du Sud |
| Nationalité | Coréo-américaine |
| Institution(s) actuelle(s) | Université Stanford — Professeure titulaire de la chaire Dieter Schwarz et Senior Fellow, Informatique et HAI (2025–présent) |
| Domaines de recherche | Traitement automatique des langues naturelles, IA de bon sens, Raisonnement moral, IA neuro-symbolique, Alignement pluraliste, IA pour la science, Fondements des modèles de langue |
| Directrice de thèse | Claire Cardie |
| Thèse de doctorat | Analyse d’opinion fine : approches sensibles à la structure (Université Cornell, 2010) |
| Site web | yejinc.github.io |
| X / Twitter | @YejinChoinka |
| GitHub | yejinc |
| Google Scholar | Yejin Choi |
Aperçu
Yejin Choi (coréen : 최예진) est une chercheuse coréo-américaine en TALN et boursière MacArthur 2022 qui est aujourd’hui professeure titulaire de la chaire Dieter Schwarz à l’Université Stanford et Senior Fellow au Stanford Institute for Human-Centered Artificial Intelligence (HAI). Sa carrière est exceptionnellement large : elle est passée de l’analyse d’opinion et de sentiment (son travail de doctorat à Cornell) au sous-titrage d’images et au langage visuel (obtenant le prix CVPR Longuet-Higgins et le prix ICCV Marr), au raisonnement de bon sens et aux bases de connaissances (ATOMIC, COMET, Winogrande, à l’Université de Washington et à l’Allen Institute for AI), aux systèmes d’IA morale (Delphi), à la recherche sur les limites et les échecs des grands modèles de langue, à l’IA pour la science chez NVIDIA, et plus récemment à l’alignement pluraliste et à la thèse selon laquelle des « algorithmes plus brillants » peuvent transcender les lois de l’échelle. Elle a reçu des prix du meilleur article ou article exceptionnel dans plus de quinze grandes conférences couvrant le TALN, la vision et l’apprentissage automatique, a donné une conférence TED vue par des millions de personnes, a fait un exposé au Conseil de sécurité des Nations Unies sur la sécurité de l’IA en septembre 2025, et fait partie des TIME100 IA en 2023 et 2025. L’ampleur de son travail est égalée par son profil public : aucune chercheuse active en TALN n’a communiqué l’écart entre les capacités apparentes de l’IA et ses limitations sous-jacentes — ce qu’elle appelle le fait d’être « incroyablement intelligente et terriblement stupide » — à un public général plus large.
Jeunesse et formation
Choi est née en Corée du Sud en 1977. Elle a obtenu une licence en informatique à l’Université nationale de Séoul avant de se rendre aux États-Unis pour des études supérieures. À l’Université Cornell, elle a travaillé avec Claire Cardie en traitement automatique des langues naturelles, obtenant son doctorat en 2010 avec une thèse intitulée Analyse d’opinion fine : approches sensibles à la structure. La thèse a développé des modèles probabilistes structurés pour identifier les détenteurs d’opinion, les cibles et la polarité des sentiments dans le texte — une contribution précoce à ce qui est devenu le domaine de l’analyse des sentiments basée sur les aspects. Ses travaux sur l’identification d’opinions trompeuses (y compris la détection de faux avis d’hôtels, publiés à ACL 2011 avec Myle Ott, Claire Cardie et Jeffrey Hancock) ont valu le prix ACL Test of Time 2021, les reconnaissant comme un résultat fondateur dans la détection computationnelle de la tromperie.
Carrière
Université Stony Brook — Professeure adjointe (2010–2013)
Après avoir obtenu son doctorat, Choi a rejoint le département d’informatique de l’Université Stony Brook en tant que professeure adjointe. Durant cette période, elle a étendu son travail en TALN pour inclure l’ancrage du langage visuel. Son projet BabyTalk — générant des descriptions en langage naturel d’images — était une démonstration précoce du sous-titrage automatique d’images, publié dans IEEE TPAMI. Les travaux de cette période ont été reconnus par le prix CVPR 2021 Longuet-Higgins (pour leur influence durable sur le domaine) et le prix ICCV 2013 Marr (meilleur article), ce dernier pour des travaux sur l’apprentissage de catégories de base à partir de grands ensembles de données d’images avec le groupe d’Alexander Berg.
Université de Washington — Professeure (2013–2024)
Choi a rejoint la Paul G. Allen School of Computer Science & Engineering de l’Université de Washington, où elle a passé plus d’une décennie en tant que l’une de ses chercheuses en TALN les plus éminentes. Elle a occupé la chaire de développement de carrière Brett Helsel (2020–2023) et la chaire Wissner-Slivka (2023–2024). Durant cette période, elle a codirigé le groupe Mosaic à l’Allen Institute for AI (AI2), intégré à l’UW avec les chercheurs d’AI2.
IA de bon sens : ATOMIC et COMET. L’engagement intellectuel le plus constant des années de Choi à l’UW était la question de savoir si les systèmes d’IA pouvaient acquérir et raisonner avec des connaissances de bon sens — la compréhension implicite des événements quotidiens, de la causalité et des normes sociales que les humains tiennent pour acquise mais qui faisait systématiquement défaut aux systèmes de TALN. Elle a assemblé ATOMIC (Atlas of Machine Commonsense), un graphe de connaissances de plus de 300 000 relations inférentielles de type si-alors couvrant les causes, les effets, les intentions et les réactions des événements quotidiens (publié à AAAI 2019, prix du meilleur article 2020). ATOMIC est devenu la plus grande base de connaissances de bon sens ouverte de son genre. S’appuyant sur cela, elle a développé COMET (Commonsense Transformers), montrant que les grands modèles de langue affinés sur ATOMIC pouvaient générer de nouvelles inférences de bon sens en langage naturel — une démonstration précoce des LLM en tant que systèmes de complétion de bases de connaissances implicites. Le programme a été couvert par Quanta Magazine („Common Sense Comes to Computers“) et Axios.
Winogrande. Choi a dirigé la construction de Winogrande, un ensemble de données participatif à grande échelle pour le défi du schéma de Winograd — une classe de problèmes de désambiguïsation des pronoms conçue spécifiquement pour nécessiter un raisonnement de bon sens. Winogrande (NeurIPS 2020) a utilisé un algorithme de filtrage adverse pour supprimer les artefacts de données qui permettent aux modèles de tricher, créant un benchmark considérablement plus difficile que les versions précédentes. L’ensemble de données est devenu une évaluation standard pour le raisonnement de bon sens dans les modèles de langue.
Delphi et l’IA morale. Le groupe de Choi a développé Delphi, un modèle computationnel de jugements moraux (2021), et l’ensemble de données Commonsense Norm Bank associé. Delphi a été l’une des premières tentatives à grande échelle d’entraîner un modèle sur des intuitions morales explicites dans diverses situations sociales, générant des évaluations morales lisibles par l’homme. Le projet a été présenté par le New York Times („Can a Machine Learn Morality?“) et a suscité un débat public soutenu sur le rôle de l’IA dans la prise de décision éthique. Choi a maintenu une position nuancée : Delphi a été conçu comme un outil de recherche pour comprendre le raisonnement normatif dans les modèles de langue, et non comme une prescription sur la façon dont l’IA devrait prendre des décisions morales.
Prix Alexa. L’équipe de l’UW dirigée par Choi (le projet Sounding Board) a remporté le premier prix Amazon Alexa pour avoir développé l’IA conversationnelle la plus engageante en domaine ouvert parmi les équipes universitaires.
Limitations de l’IA et IA „terriblement stupide“. En parallèle de son travail constructif sur le bon sens, Choi a développé une voix intellectuelle publique autour de l’écart entre les capacités de surface des grands modèles de langue et leur compréhension sous-jacente. Sa conférence TED 2023, „Why AI is Incredibly Smart — and Shockingly Stupid“, est devenue largement visionnée et fait partie des contributions académiques les plus partagées à la compréhension publique des limites des LLM.
Allen Institute for AI (AI2) — Responsable de recherche senior, Groupe Mosaic (2018–2024)
En 2018, Choi a rejoint AI2 en tant que chercheuse senior intégrée à l’UW, codirigeant le groupe Mosaic — le programme de recherche sur l’IA de bon sens qui a produit ATOMIC, COMET, Winogrande et les ressources de connaissances et de raisonnement associées. Elle a conservé une nomination conjointe là-bas tout au long de son mandat à l’UW.
NVIDIA — Scientifique distinguée (2024–2025)
Avant de rejoindre Stanford, Choi a occupé un poste de scientifique distinguée chez NVIDIA, où ses travaux se sont étendus à l’IA pour la science — modèles de fondation moléculaires, raisonnement sur les protéines, prédiction de structures cristallines — et ont contribué à la famille de modèles Nemotron. Elle a également développé des travaux sur le contournement des lois de l’échelle avec des « algorithmes plus brillants » : la thèse selon laquelle les progrès dans la conception d’algorithmes, les stratégies d’entraînement et le choix des données (plutôt que la mise à l’échelle brute du calcul) peuvent débloquer des améliorations qualitatives des capacités dans les modèles petits et moyens. Les articles de cette période incluent des travaux sur l’apprentissage par renforcement prolongé, l’entraînement au moment du test et de nouvelles approches de tokenisation.
Université Stanford (2025–présent)
En 2025, Stanford HAI a annoncé la nomination de Choi en tant que professeure titulaire de la chaire Dieter Schwarz en informatique et Senior Fellow à HAI. Ses intérêts de recherche à Stanford couvrent l’IA pour la science (raisonnement moléculaire et protéique), l’alignement pluraliste et les valeurs en IA, les algorithmes alternatifs d’entraînement et d’inférence, et l’étude des limites des LLM. En septembre 2025, elle a fait un exposé au Conseil de sécurité des Nations Unies sur la sécurité de l’IA, l’une des invitations de politique publique les plus importantes qu’un chercheur en IA ait reçues.
Contributions clés
-
Détection de faux avis (ACL 2011 ; prix ACL Test of Time 2021) — „Finding Deceptive Opinion Spam by Any Stretch of the Imagination“, avec Myle Ott, Claire Cardie et Jeffrey Hancock. A introduit la première grande étude sur la génération et la détection d’opinions trompeuses, démontrant que l’apprentissage automatique pouvait identifier les faux avis d’hôtels avec une précision supérieure au hasard. A reçu le prix ACL Test of Time une décennie plus tard pour son impact fondateur sur la recherche en crédibilité computationnelle.
-
BabyTalk / Sous-titrage d’images (prix CVPR Longuet-Higgins 2021) — „BabyTalk: Understanding and Generating Simple Image Descriptions“, TPAMI 2013, avec Girish Kulkarni, Vicente Ordonez et le groupe Berg. L’un des premiers systèmes automatisés de description d’images en langage naturel, recevant une reconnaissance rétroactive en tant que contribution fondatrice au domaine de l’ancrage vision-langage.
-
Catégories de base (prix ICCV 2013 Marr) — Travail sur l’apprentissage du niveau d’abstraction auquel les humains nomment naturellement les objets dans les images, remportant le prix du meilleur article à ICCV 2013.
-
ATOMIC (AAAI 2019 ; AAAI 2020 article exceptionnel) — Atlas of Machine Commonsense : un graphe de connaissances de plus de 300 000 règles inférentielles de type si-alors couvrant les causes, les effets, les intentions et les réactions des événements quotidiens. La plus grande base de connaissances de bon sens ouverte de son époque, formant la base de COMET et de plusieurs générations de systèmes de raisonnement de bon sens.
-
COMET (ACL 2019) — Commonsense Transformers : modèles de langue affinés qui génèrent de nouvelles inférences de bon sens à partir d’ATOMIC, démontrant les LLM en tant que systèmes génératifs de complétion de bases de connaissances et en tant que moteurs d’inférence de bon sens.
-
Winogrande (NeurIPS 2020) — Un ensemble de données participatif à grande échelle filtré de manière adverse pour le raisonnement de bon sens du schéma de Winograd, considérablement plus difficile que les versions antérieures et largement adopté comme benchmark standard pour mesurer la compréhension du bon sens dans les modèles de langue.
-
Delphi (2021) — Un modèle computationnel de jugement moral entraîné sur l’ensemble de données Commonsense Norm Bank, l’une des premières tentatives de créer un modèle de langue qui produit des évaluations morales lisibles par l’homme dans diverses situations sociales. Présenté dans le New York Times et a contribué à un débat public plus large sur l’IA et l’éthique.
-
Alignement pluraliste et contournement des lois de l’échelle — Un programme de recherche soutenu (2023–présent) arguant que les diverses valeurs et perspectives humaines doivent être explicitement représentées dans l’entraînement de l’IA plutôt que moyennées, combiné à un programme technique démontrant qu’une conception d’algorithme intelligente peut réaliser des améliorations de capacité sans simplement mettre à l’échelle le calcul.
Prix et distinctions
- Bourse MacArthur (2022) — La « bourse du génie » de la Fondation MacArthur, décernée pour une créativité et un potentiel exceptionnels.
- ACL Fellow (2022) — Fellow de l’Association for Computational Linguistics.
- TIME100 IA (2025 et 2023) — Nommée sur la liste des 100 personnes les plus influentes dans le domaine de l’IA du magazine Time les deux années.
- AI2050 Senior Fellow (2024) — Nommée par le programme AI2050 de Schmidt Sciences.
- Exposé au Conseil de sécurité de l’ONU (septembre 2025) — A présenté un exposé sur la sécurité de l’IA au Conseil de sécurité des Nations Unies.
- Prix du meilleur article/article exceptionnel — À NeurIPS 2025 (deux prix), EMNLP 2025 (deux prix), ACL 2025 (deux prix), EMNLP 2023, ACL 2023 (deux prix), NAACL 2022, ICML 2022, NeurIPS 2021, AAAI 2020.
- Prix CVPR Longuet-Higgins (2021) — Pour le travail sur le sous-titrage d’images BabyTalk.
- Prix ACL Test of Time (2021) — Pour l’article sur la détection des faux avis.
- Prix ICCV 2013 Marr — Prix du meilleur article à la Conférence internationale sur la vision par ordinateur.
- Prix Anita Borg pour les débuts de carrière (BECA, 2018) — Prix CRA-WP pour les femmes exceptionnelles en début de carrière en informatique.
- IEEE AI’s 10 to Watch (2016) — Nommée parmi les dix chercheurs en début de carrière les plus influents en IA par l’IEEE.
- Gagnante du prix Alexa — L’équipe Sounding Board de l’Université de Washington (dirigée par Choi) a remporté le premier prix Amazon Alexa.
Relations clés
- Claire Cardie — Directrice de thèse à Cornell ; chercheuse de premier plan en extraction d’informations et analyse d’opinion qui a façonné l’orientation fondatrice de Choi en TALN.
- Hannaneh Hajishirzi — Collègue de longue date à l’Université de Washington ; co-auteure fréquente sur les fondements des modèles de langue, les modèles ouverts (OLMo, OLMoTrace) et la compréhension de la lecture.
- Luke Zettlemoyer — Collègue de l’Université de Washington ; co-auteur de plusieurs benchmarks TALN, d’analyses de modèles de langue et de recherches sur l’ancrage.
- Maarten Sap — Doctorant qui a co-écrit ATOMIC, COMET et plusieurs articles sur l’IA morale/le bon sens ; maintenant professeur adjoint à CMU.
- Ronan Le Bras — Collaborateur de longue date à AI2 sur les ressources de bon sens et les benchmarks de raisonnement.
- Liwei Jiang — Doctorante à UW/Stanford travaillant sur l’alignement pluraliste, les valeurs en IA et le raisonnement normatif.
- Ximing Lu — Collaborateur proche et chercheur sur le raisonnement, le RLVR et l’entraînement de modèles ; apparu dans des dizaines d’articles récents.
- Noah A. Smith — Professeur à l’UW et collaborateur fréquent sur l’évaluation, les données et les fondements du TALN des modèles de langue.
Style personnel
Choi est l’une des chercheuses académiques en IA les plus visibles publiquement de sa génération — non pas principalement via les réseaux sociaux, mais par un effort constant pour communiquer la réalité nuancée des capacités de l’IA à des publics non spécialistes. Sa conférence TED, son profil dans le New Yorker, sa couverture dans Quanta Magazine, son apparition dans This American Life et son podcast avec Bill Gates ont collectivement atteint des audiences de plusieurs dizaines de millions, et elle aborde ces opportunités avec la même précision intellectuelle qu’elle apporte à son travail technique : résistant à la fois au battage médiatique de l’IA et au rejet de l’IA en faveur d’une articulation précise de ce que les systèmes actuels peuvent et ne peuvent pas faire. Son programme de recherche est ambitieux par son ampleur — l’IA de bon sens, le raisonnement moral, l’alignement pluraliste et l’IA pour la science sont chacun suffisamment vastes pour ancrer un programme de recherche entier, et elle les poursuit tous simultanément. Elle a parlé de l’importance de la représentation en IA, des biais dans les systèmes de langage et de vision qui désavantagent les groupes sous-représentés, et de l’obligation des chercheurs en IA de participer au discours politique public. Son exposé de septembre 2025 au Conseil de sécurité de l’ONU représente l’intersection la plus directe de ses recherches avec la gouvernance internationale de la technologie qu’elle étudie.
Références
- Site personnel : yejinc.github.io
- Profil Stanford HAI : hai.stanford.edu
- Wikipédia : Yejin Choi
- Google Scholar : scholar.google.com
- Fondation MacArthur : macfound.org
- Conférence TED (2023) : ted.com
- Profil New Yorker : newyorker.com
- TIME100 AI 2025 : time.com
- Exposé au Conseil de sécurité de l’ONU : hai.stanford.edu
- Profil Digg : digg.com/u/x/yejinchoinka