Pesquisadora coreano-americana de PLN e MacArthur Fellow cuja carreira traçou um arco da mineração de opinião e legendagem de imagens até bases de conhecimento de senso comum, IA de raciocínio moral e a defesa de contornar leis de escalabilidade com algoritmos mais inteligentes — atualmente em Stanford como Professora da Dieter Schwarz Foundation.
Perfil
| Nascimento | 1977, Coreia do Sul |
| Nacionalidade | Coreano-americana |
| Instituição(ões) atual(is) | Universidade de Stanford — Professora da Dieter Schwarz Foundation e Senior Fellow, Ciência da Computação e HAI (2025–presente) |
| Áreas de Pesquisa | Processamento de Linguagem Natural, IA de Senso Comum, Raciocínio Moral, IA Neuro-Simbólica, Alinhamento Pluralista, IA para a Ciência, Fundamentos de Modelos de Linguagem |
| Orientador de Doutorado | Claire Cardie |
| Tese de Doutorado | Fine-Grained Opinion Analysis: Structure-Aware Approaches (Universidade Cornell, 2010) |
| Site | yejinc.github.io |
| X / Twitter | @YejinChoinka |
| GitHub | yejinc |
| Google Acadêmico | Yejin Choi |
Visão Geral
Yejin Choi (em coreano: 최예진) é uma pesquisadora coreano-americana de PLN e MacArthur Fellow de 2022 que agora é Professora da Dieter Schwarz Foundation na Universidade de Stanford e Senior Fellow no Stanford Institute for Human-Centered Artificial Intelligence (HAI). Sua carreira é excepcionalmente ampla: ela transitou da mineração de opinião e análise de sentimentos (seu trabalho de doutorado em Cornell) para legendagem de imagens e linguagem visual (conquistando o Prêmio CVPR Longuet-Higgins e o Prêmio ICCV Marr), para raciocínio de senso comum e bases de conhecimento (ATOMIC, COMET, Winogrande, na Universidade de Washington e no Allen Institute for AI), para sistemas de IA moral (Delphi), para pesquisas sobre os limites e falhas de grandes modelos de linguagem, para IA para a ciência na NVIDIA, e mais recentemente para alinhamento pluralista e a tese de que «algoritmos mais brilhantes» podem transcender as leis de escalabilidade. Ela recebeu prêmios de melhor artigo ou artigo de destaque em mais de quinze grandes eventos em PLN, visão computacional e ML, apresentou uma palestra TED assistida por milhões, informou o Conselho de Segurança das Nações Unidas sobre segurança de IA em setembro de 2025, e foi nomeada entre os TIME100 AI tanto em 2023 quanto em 2025. A amplitude de seu trabalho é acompanhada por seu perfil público: nenhum pesquisador ativo de PLN comunicou a lacuna entre as capacidades aparentes da IA e suas limitações subjacentes — o que ela chama de ser «incrivelmente inteligente e chocantemente estúpida» — a um público não especializado tão amplo.
Primeiros Anos e Educação
Choi nasceu na Coreia do Sul em 1977. Concluiu o bacharelado em Ciência da Computação na Universidade Nacional de Seul antes de se mudar para os Estados Unidos para estudos de pós-graduação. Na Universidade Cornell, trabalhou com Claire Cardie em processamento de linguagem natural, concluindo seu PhD em 2010 com uma dissertação intitulada Fine-Grained Opinion Analysis: Structure-Aware Approaches. A tese desenvolveu modelos probabilísticos estruturados para identificar detentores de opinião, alvos e polaridade de sentimentos em textos — uma contribuição inicial para o que se tornou o campo da análise de sentimentos baseada em aspectos. Seu trabalho sobre identificação de opinião enganosa (incluindo detecção de avaliações falsas de hotéis, publicado no ACL 2011 com Myle Ott, Claire Cardie e Jeffrey Hancock) rendeu o Prêmio ACL Test of Time de 2021, reconhecendo-o como um resultado fundamental na detecção computacional de enganos.
Carreira
Stony Brook University — Professora Assistente (2010–2013)
Após concluir seu PhD, Choi ingressou no Departamento de Ciência da Computação da Stony Brook University como professora assistente. Durante este período, ela estendeu seu trabalho em PLN para incluir a fundamentação da linguagem visual. Seu projeto BabyTalk — gerando descrições em linguagem natural de imagens — foi uma demonstração inicial de legendagem automática de imagens, publicado no IEEE TPAMI. O trabalho deste período foi reconhecido com o Prêmio CVPR Longuet-Higgins de 2021 (por sua influência duradoura no campo) e o Prêmio ICCV Marr de 2013 (melhor artigo), este último por trabalho sobre aprendizado de categorias de nível básico a partir de conjuntos de dados de imagens em grande escala com o grupo de Alexander Berg.
Universidade de Washington — Professora (2013–2024)
Choi ingressou na Paul G. Allen School of Computer Science & Engineering da Universidade de Washington, onde passaria mais de uma década como uma de suas pesquisadoras de PLN mais proeminentes. Ela ocupou a Brett Helsel Career Development Professorship (2020–2023) e a Cátedra Wissner-Slivka (2023–2024). Durante este período, ela co-liderou o grupo Mosaic no Allen Institute for AI (AI2), integrada à UW com pesquisadores do AI2.
IA de Senso Comum: ATOMIC e COMET. O compromisso intelectual mais constante dos anos de Choi na UW foi a questão de saber se os sistemas de IA poderiam adquirir e raciocinar com conhecimento de senso comum — a compreensão implícita de eventos cotidianos, causalidade e normas sociais que os humanos consideram garantidos, mas que os sistemas de PLN consistentemente não possuíam. Ela montou o ATOMIC (Atlas of Machine Commonsense), um grafo de conhecimento com mais de 300.000 relações inferenciais do tipo se-então cobrindo causas, efeitos, intenções e reações de eventos cotidianos (publicado no AAAI 2019, Prêmio de Artigo de Destaque 2020). O ATOMIC tornou-se a maior base de conhecimento aberta de senso comum de seu tipo. Com base nele, ela desenvolveu o COMET (Commonsense Transformers), mostrando que grandes modelos de linguagem ajustados no ATOMIC poderiam gerar novas inferências de senso comum em linguagem natural — uma demonstração inicial de LLMs como sistemas de conclusão de base de conhecimento implícita. O programa foi coberto pela Quanta Magazine (“Common Sense Comes to Computers”) e pela Axios.
Winogrande. Choi liderou a construção do Winogrande, um conjunto de dados crowdsourced em grande escala para o desafio do esquema de Winograd — uma classe de problemas de desambiguação de pronomes projetados especificamente para exigir raciocínio de senso comum. O Winogrande (NeurIPS 2020) usou um algoritmo de filtragem adversarial para remover artefatos de dados que permitem que modelos trapaceiem, criando um benchmark substancialmente mais difícil do que versões anteriores. O conjunto de dados tornou-se uma avaliação padrão para raciocínio de senso comum em modelos de linguagem.
Delphi e IA moral. O grupo de Choi desenvolveu o Delphi, um modelo computacional de julgamentos morais (2021), e o conjunto de dados Commonsense Norm Bank associado. O Delphi foi uma das primeiras tentativas em grande escala de treinar um modelo em intuições morais explícitas em diversas situações sociais, gerando avaliações morais legíveis por humanos. O projeto foi destaque no The New York Times (“Can a Machine Learn Morality?”) e gerou discussão pública sustentada sobre o papel da IA na tomada de decisões éticas. Choi manteve uma posição matizada: o Delphi foi projetado como uma ferramenta de pesquisa para compreender o raciocínio normativo em modelos de linguagem, não como uma prescrição de como a IA deveria tomar decisões morais.
Alexa Prize. A equipe da UW liderada por Choi (projeto Sounding Board) venceu o inaugural Amazon Alexa Prize por desenvolver a IA conversacional de domínio aberto mais envolvente entre equipes universitárias.
Limitações da IA e IA «chocantemente estúpida». Paralelamente ao seu trabalho construtivo sobre senso comum, Choi desenvolveu uma voz intelectual pública em torno da lacuna entre as capacidades superficiais de grandes modelos de linguagem e sua compreensão subjacente. Sua palestra TED de 2023, “Why AI is Incredibly Smart — and Shockingly Stupid”, tornou-se amplamente assistida e está entre as contribuições acadêmicas mais compartilhadas para a compreensão pública das limitações dos LLMs.
Allen Institute for AI (AI2) — Gerente Sênior de Pesquisa, Grupo Mosaic (2018–2024)
Em 2018, Choi ingressou no AI2 como pesquisadora sênior integrada à UW, co-liderando o grupo Mosaic — o programa de pesquisa em IA de senso comum que produziu ATOMIC, COMET, Winogrande e recursos relacionados de conhecimento e raciocínio. Ela manteve uma nomeação conjunta lá durante todo o seu tempo na UW.
NVIDIA — Cientista Distinta (2024–2025)
Antes de ingressar em Stanford, Choi ocupou um cargo de Cientista Distinta na NVIDIA, onde seu trabalho se expandiu para IA para a ciência — modelos de base molecular, raciocínio sobre proteínas, previsão de estrutura cristalina — e contribuiu para a família de modelos Nemotron. Ela também desenvolveu trabalhos sobre contornar leis de escalabilidade com «algoritmos mais brilhantes»: a tese de que avanços no design de algoritmos, estratégias de treinamento e curadoria de dados (em vez de escalabilidade bruta de computação) podem desbloquear melhorias qualitativas de capacidade em modelos pequenos e médios. Artigos deste período incluem trabalhos sobre aprendizado por reforço prolongado, treinamento em tempo de teste e novas abordagens de tokenização.
Universidade de Stanford (2025–presente)
Em 2025, o Stanford HAI anunciou a nomeação de Choi como Professora da Dieter Schwarz Foundation de Ciência da Computação e Senior Fellow no HAI. Seus interesses de pesquisa em Stanford abrangem IA para a ciência (raciocínio molecular e sobre proteínas), alinhamento pluralista e valores em IA, algoritmos alternativos de treinamento e inferência, e o estudo das limitações dos LLMs. Em setembro de 2025, ela informou o Conselho de Segurança das Nações Unidas sobre segurança de IA, um dos convites de políticas públicas mais proeminentes que qualquer pesquisador de IA já recebeu.
Principais Contribuições
-
Detecção de Avaliações Falsas (ACL 2011; Prêmio ACL Test of Time 2021) — “Finding Deceptive Opinion Spam by Any Stretch of the Imagination”, com Myle Ott, Claire Cardie e Jeffrey Hancock. Introduziu o primeiro estudo em grande escala de geração e detecção de opinião enganosa, demonstrando que o aprendizado de máquina poderia identificar avaliações falsas de hotéis com precisão acima do acaso. Recebeu o Prêmio ACL Test of Time uma década depois pelo impacto fundamental na pesquisa de credibilidade computacional.
-
BabyTalk / Legendagem de Imagens (Prêmio CVPR Longuet-Higgins 2021) — “BabyTalk: Understanding and Generating Simple Image Descriptions”, TPAMI 2013, com Girish Kulkarni, Vicente Ordonez e o grupo Berg. Um dos primeiros sistemas automatizados de descrição em linguagem natural para imagens, ganhando reconhecimento retroativo como uma contribuição fundamental para o campo de fundamentação visão-linguagem.
-
Categorias de Nível Básico (Prêmio ICCV Marr 2013) — Trabalho sobre aprendizado do nível de abstração no qual os humanos nomeiam naturalmente objetos em imagens, ganhando o prêmio de melhor artigo no ICCV 2013.
-
ATOMIC (AAAI 2019; Prêmio de Artigo de Destaque AAAI 2020) — Atlas of Machine Commonsense: um grafo de conhecimento com mais de 300.000 regras inferenciais do tipo se-então cobrindo causas, efeitos, intenções e reações de eventos cotidianos. A maior base de conhecimento aberta de senso comum de sua época, formando a base para o COMET e múltiplas gerações de sistemas de raciocínio de senso comum.
-
COMET (ACL 2019) — Commonsense Transformers: modelos de linguagem ajustados que geram novas inferências de senso comum a partir do ATOMIC, demonstrando LLMs como sistemas generativos de conclusão de base de conhecimento e como mecanismos de inferência de senso comum.
-
Winogrande (NeurIPS 2020) — Um conjunto de dados crowdsourced em grande escala, filtrado adversariamente, para raciocínio de senso comum de esquema de Winograd, substancialmente mais difícil que versões anteriores e amplamente adotado como um benchmark padrão para medir a compreensão de senso comum em modelos de linguagem.
-
Delphi (2021) — Um modelo computacional de julgamento moral treinado no conjunto de dados Commonsense Norm Bank, uma das primeiras tentativas de criar um modelo de linguagem que produz avaliações morais legíveis por humanos em diversas situações sociais. Destaque no The New York Times e contribuiu para o debate público mais amplo sobre IA e ética.
-
Alinhamento Pluralista e Contornando Leis de Escalabilidade — Uma agenda de pesquisa sustentada (2023–presente) argumentando que diversos valores e perspectivas humanas devem ser explicitamente representados no treinamento de IA, em vez de serem diluídos, combinada com um programa técnico demonstrando que o design inteligente de algoritmos pode alcançar melhorias de capacidade sem simplesmente escalar a computação.
Prêmios e Reconhecimento
- MacArthur Fellowship (2022) — A «bolsa de gênios» da Fundação MacArthur, concedida por criatividade e potencial excepcionais.
- ACL Fellow (2022) — Fellow da Association for Computational Linguistics.
- TIME100 AI (2025 e 2023) — Nomeada para a lista da Time das 100 pessoas mais influentes em IA em ambos os anos.
- AI2050 Senior Fellow (2024) — Nomeada pelo programa AI2050 da Schmidt Sciences.
- Briefing ao Conselho de Segurança da ONU (setembro de 2025) — Informou o Conselho de Segurança da ONU sobre segurança de IA.
- Prêmios de Melhor Artigo/Artigo de Destaque — No NeurIPS 2025 (dois prêmios), EMNLP 2025 (dois prêmios), ACL 2025 (dois prêmios), EMNLP 2023, ACL 2023 (dois prêmios), NAACL 2022, ICML 2022, NeurIPS 2021, AAAI 2020.
- Prêmio CVPR Longuet-Higgins (2021) — Pelo trabalho de legendagem de imagens BabyTalk.
- Prêmio ACL Test of Time (2021) — Pelo artigo de detecção de avaliações falsas.
- Prêmio ICCV Marr 2013 — Prêmio de melhor artigo na International Conference on Computer Vision.
- Anita Borg Early Career Award (BECA, 2018) — Prêmio CRA-WP para mulheres em computação em início de carreira.
- IEEE AI’s 10 to Watch (2016) — Nomeada entre os dez pesquisadores de IA em início de carreira mais influentes pelo IEEE.
- Vencedora do Alexa Prize — A equipe Sounding Board da Universidade de Washington (liderada por Choi) venceu o inaugural Amazon Alexa Prize.
Principais Relacionamentos
- Claire Cardie — Orientadora de PhD em Cornell; uma pesquisadora líder em extração de informação e mineração de opinião que moldou a orientação fundamental de Choi em PLN.
- Hannaneh Hajishirzi — Colega de longa data na Universidade de Washington; coautora frequente em fundamentos de modelos de linguagem, modelos abertos (OLMo, OLMoTrace) e compreensão de leitura.
- Luke Zettlemoyer — Colega na Universidade de Washington; coautor em múltiplos benchmarks de PLN, análise de modelos de linguagem e pesquisa de fundamentação.
- Maarten Sap — Aluno de doutorado que coautorou ATOMIC, COMET e múltiplos artigos sobre IA moral/de senso comum; agora professor assistente na CMU.
- Ronan Le Bras — Colaborador de longa data no AI2 em recursos de senso comum e benchmarks de raciocínio.
- Liwei Jiang — Aluna de doutorado na UW/Stanford trabalhando em alinhamento pluralista, valores em IA e raciocínio normativo.
- Ximing Lu — Colaborador próximo e pesquisador em raciocínio, RLVR e treinamento de modelos; apareceu em dezenas de artigos recentes.
- Noah A. Smith — Professor da UW e colaborador frequente em avaliação, dados e fundamentos de PLN de modelos de linguagem.
Estilo Pessoal
Choi é uma das pesquisadoras acadêmicas de IA mais voltadas ao público de sua geração — não principalmente através de mídias sociais, mas através de um esforço consistente para comunicar a realidade matizada das capacidades da IA a públicos não especialistas. Sua palestra TED, perfil no New Yorker, cobertura da Quanta Magazine, aparição no This American Life e podcast de Bill Gates alcançaram coletivamente públicos na casa das dezenas de milhões, e ela aborda essas oportunidades com a mesma precisão intelectual que traz ao trabalho técnico: resistindo tanto ao hype quanto à rejeição da IA em favor de uma articulação precisa do que os sistemas atuais podem e não podem fazer. Sua agenda de pesquisa é caracteristicamente ambiciosa em escopo — IA de senso comum, raciocínio moral, alinhamento pluralista e IA para a ciência são cada um suficientemente grande para ancorar um programa de pesquisa inteiro, e ela os persegue todos simultaneamente. Ela falou sobre a importância da representação na IA, sobre viés em sistemas de linguagem e visão que desfavorece grupos sub-representados e sobre a obrigação dos pesquisadores de IA de participar do discurso de políticas públicas. Seu briefing de setembro de 2025 ao Conselho de Segurança da ONU representa a interseção mais direta de sua pesquisa com a governança internacional da tecnologia que ela estuda.
Referências
- Site pessoal: yejinc.github.io
- Perfil no Stanford HAI: hai.stanford.edu
- Wikipédia: Yejin Choi
- Google Acadêmico: scholar.google.com
- Fundação MacArthur: macfound.org
- Palestra TED (2023): ted.com
- Perfil no New Yorker: newyorker.com
- TIME100 AI 2025: time.com
- Briefing ao Conselho de Segurança da ONU: hai.stanford.edu
- Perfil no Digg: digg.com/u/x/yejinchoinka