Chelsea Finn

Professor Assistente de Ciência da Computação e Engenharia Elétrica na Universidade de Stanford, inventor do Aprendizado Meta-Agnóstico de Modelos (MAML), coautor da Otimização Direta de Preferências (DPO) e cofundador da Physical Intelligence — um dos pesquisadores em início de carreira mais citados em aprendizado de máquina e robótica.


Perfil

Área Detalhe
Nascimento 8 de outubro de 1992, Estados Unidos
Nacionalidade Americana
Instituições Atuais Universidade de Stanford (Laboratório IRIS); Physical Intelligence (Cofundadora)
Áreas de Pesquisa Meta-aprendizado, Aprendizado Robótico, Aprendizado por Reforço, Aprendizado por Imitação, Modelos Visão-Linguagem-Ação
Orientadores de Doutorado Sergey Levine; Pieter Abbeel
Tese de Doutorado Learning to Learn with Gradients (UC Berkeley, 2018)
Site Acadêmico ai.stanford.edu/~cbfinn
X / Twitter @chelseabfinn
GitHub @cbfinn
Google Scholar scholar.google.com (126.000+ citações)

Visão Geral

Chelsea Finn é uma cientista da computação americana e uma das pesquisadoras mais influentes de sua geração na interseção entre aprendizado de máquina e robótica. Ela é mais conhecida por inventar o Model-Agnostic Meta-Learning (MAML), um algoritmo baseado em gradiente publicado no ICML 2017 que se tornou um dos artigos mais citados da década e estabeleceu o meta-aprendizado como uma importante direção de pesquisa. Como coautora da Otimização Direta de Preferências (DPO, NeurIPS 2023), ela contribuiu com uma segunda técnica de alto impacto, desta vez para alinhamento de modelos de linguagem, que rapidamente substituiu as abordagens baseadas em RLHF em ambientes acadêmicos e industriais. Finn dirige o Laboratório IRIS (Intelligence through Robotic Interaction at Scale) em Stanford, onde possui nomeações conjuntas em Ciência da Computação e Engenharia Elétrica como William George e Ida Mary Hoover Faculty Fellow. Em 2024, ela cofundou a Physical Intelligence (Pi), uma empresa de IA robótica que levantou US$ 400 milhões com uma avaliação de US$ 2,8 bilhões e está desenvolvendo modelos de base de propósito geral para robôs físicos. Ela acumulou mais de 126.000 citações no Google Scholar — um número excepcional para uma pesquisadora que concluiu seu doutorado em 2018.


Início da Vida e Educação

Bacharelado em Engenharia Elétrica e Ciência da Computação — Instituto de Tecnologia de Massachusetts
Finn concluiu sua graduação no MIT em EECS, construindo a base técnica em aprendizado de máquina e sistemas de controle que moldaria sua pesquisa de pós-graduação.

Doutorado em Ciência da Computação — Universidade da Califórnia, Berkeley, 2018
Finn ingressou no Berkeley Artificial Intelligence Research Lab (BAIR), orientada conjuntamente por Sergey Levine e Pieter Abbeel. Sua dissertação, Learning to Learn with Gradients, desenvolveu o arcabouço teórico e algorítmico para meta-aprendizado baseado em gradiente — a ideia de que os parâmetros de um modelo podem ser otimizados para servir como uma excelente inicialização para rápida adaptação a novas tarefas através de um pequeno número de passos de gradiente. A dissertação recebeu o ACM Doctoral Dissertation Award, o mais alto reconhecimento da área para uma tese de doutorado. Ela foi a primeira mulher a receber o UC Berkeley EECS C.V. & Daulat Ramamoorthy Distinguished Research Award (2016), concedido por pesquisa excepcional durante o doutorado. Durante seu doutorado, ela também estagiou no Google Brain, trabalhando em aprendizado robótico em larga escala a partir de modelos preditivos profundos.


Carreira

UC Berkeley — Laboratório BAIR (2014–2018)

Como estudante de doutorado sob Levine e Abbeel, Finn desenvolveu os métodos que definiriam sua reputação inicial: aprendizado ponta a ponta de políticas visuomotoras, predição de vídeo para interação física e — mais significativamente — o algoritmo MAML. Junto com sua pesquisa de doutorado, ela co-ministrou um curso pioneiro sobre aprendizado por reforço profundo (UC Berkeley CS294-112, primavera de 2017), co-organizou um workshop sobre aprendizado profundo para ação e interação no NeurIPS 2016, e co-organizou o BAIR Camp, um acampamento de verão de divulgação para alunos do ensino médio de famílias de baixa renda.

Google Brain — Estágio (2016–2017)

Durante seu doutorado, Finn trabalhou como estagiária de pesquisa no Google Brain, contribuindo para projetos de aprendizado robótico envolvendo treinamento de modelos preditivos em larga escala e conjuntos de dados de agarre robótico, vários dos quais foram lançados publicamente como o corpus Google Brain Robotics Data.

Universidade de Stanford — Laboratório IRIS (2019–presente)

Finn ingressou em Stanford como professora assistente em 2019. Ela possui nomeações conjuntas em CC e EE e é afiliada ao Stanford HAI e ao Stanford ML Group. Seu laboratório, IRIS (Intelligence through Robotic Interaction at Scale), realiza pesquisas em quatro temas: aprendizado a partir de dados e demonstrações offline, meta-aprendizado e generalização, modelos visão-linguagem-ação e implantação de robôs no mundo real.

CS330: Aprendizado Multi-tarefa e Meta Aprendizado Profundo — Finn projetou e ministrou este curso em Stanford a partir do outono de 2019; vídeos de palestras de várias edições estão publicamente disponíveis e foram amplamente adotados como currículo padrão para estudos de meta-aprendizado em nível de pós-graduação globalmente.

CS224R: Aprendizado por Reforço Profundo — Finn também ministra este curso em Stanford, cobrindo métodos modernos de RL profunda e sua aplicação ao controle robótico.

Principais linhas de pesquisa em Stanford:

Durante seu mandato como professora, o laboratório de Finn contribuiu para várias linhas de pesquisa distintas. Em meta-aprendizado e generalização, o trabalho sobre robustez fora da distribuição e mudança de distribuição (incluindo o benchmark WILDS, ICML 2021) estendeu suas contribuições da era do doutorado para o problema mais amplo de ML robusto. Em aprendizado robótico, seu grupo trabalhou em RL offline e online para robótica, transferência entre corpos (série Bridge Data) e imitação humanoide (HumanPlus, 2024). Mais recentemente, o OpenVLA (2024) — um modelo de visão-linguagem-ação de código aberto desenvolvido em colaboração com colegas de Stanford e Berkeley — estabeleceu um novo padrão aberto para controle robótico generalista. Em modelos de linguagem, o DPO (2023) tornou-se uma das contribuições mais consequentes para a metodologia de alinhamento de LLMs nos últimos anos.

Physical Intelligence (Pi) — Cofundadora (2024–presente)

Em 2024, Finn cofundou a Physical Intelligence junto com Sergey Levine, Karol Hausman, Brian Ichter, Lachy Groom, Adnan Esmail e Quan Vuong. A tese da empresa — de que um único grande modelo de base pode aprender a controlar qualquer robô para qualquer tarefa, de forma análoga a como os grandes modelos de linguagem generalizaram através de texto — reflete diretamente o programa de pesquisa que Finn e Levine desenvolveram ao longo de uma década. A Physical Intelligence levantou US$ 400 milhões com uma avaliação de US$ 2,8 bilhões, com apoio da Bezos Expeditions, Khosla Ventures e do OpenAI Startup Fund. O primeiro modelo público da empresa, π0 (pi-zero), é um modelo de visão-linguagem-ação que demonstra manipulação hábil generalista em múltiplas plataformas robóticas.


Principais Contribuições

  • Model-Agnostic Meta-Learning (MAML) — Apresentado no ICML 2017 (Finn, Abbeel, Levine), o MAML introduziu um algoritmo de meta-aprendizado baseado em gradiente que otimiza parâmetros iniciais do modelo para rápida adaptação a novas tarefas com o mínimo de dados. Seu design agnóstico ao modelo significava que se aplicava a qualquer modelo treinado por gradiente — classificação, regressão ou aprendizado por reforço — e tornou-se um dos artigos fundamentais da literatura de meta-aprendizado, acumulando dezenas de milhares de citações e gerando dezenas de variantes algorítmicas, incluindo Reptile, FOMAML e iMAML.

  • Políticas Visuomotoras Profundas Ponta a Ponta — Publicado no JMLR 2016 (Levine, Finn, Darrell, Abbeel), este artigo demonstrou que redes neurais profundas poderiam aprender políticas de manipulação robótica ponta a ponta a partir de imagens de câmera e ângulos de juntas, unindo percepção visual e controle motor em um único sistema diferenciável.

  • Otimização Direta de Preferências (DPO) — Publicado no NeurIPS 2023 (Rafailov, Sharma, Mitchell, Ermon, Manning, Finn), o DPO reformulou o objetivo de aprendizado de preferências do RLHF como um problema de classificação binária supervisionada, eliminando a necessidade de um modelo de recompensa separado e as instabilidades do ajuste fino baseado em PPO. Foi quase imediatamente adotado tanto pela comunidade de pesquisa quanto pela indústria, e acumulou citações a uma das taxas mais rápidas na história recente do NeurIPS. Finn atuou como coautora sênior, fornecendo a infraestrutura do laboratório e a direção da pesquisa.

  • CS330: Aprendizado Multi-tarefa e Meta Aprendizado Profundo — Este curso de pós-graduação em Stanford criado por Finn em 2019 tornou-se o principal currículo universitário para meta-aprendizado e aprendizado multi-tarefa globalmente; suas videoaulas publicamente disponíveis alcançaram profissionais e pesquisadores muito além do corpo discente de Stanford.

  • OpenVLA: Um Modelo de Visão-Linguagem-Ação de Código Aberto — Publicado no CoRL 2024 (Kim, Pertsch, Karamcheti, et al., co-supervisionado por Finn e colaboradores), o OpenVLA estabeleceu uma linha de base livremente disponível e reprodutível para controle robótico generalista que democratizou o acesso à pesquisa VLA para a comunidade mais ampla.

  • Open X-Embodiment e RT-X — Finn fez parte da grande equipe colaborativa (ICRA 2024) que montou o conjunto de dados Open X-Embodiment abrangendo 22 corporificações robóticas e 527 habilidades, permitindo aprendizado de transferência entre corporificações e o lançando publicamente; um passo marcante em direção a modelos de base robóticos generalizáveis.

  • HumanPlus: Sombreamento e Imitação Humanoide — Publicado no CoRL 2024 (Fu, Zhao, Wu, Wetzstein, Finn), este trabalho demonstrou o aprendizado de manipulação humanoide de corpo inteiro a partir de captura de movimento humano através de uma combinação de aprendizado por imitação e aprendizado por reforço.

  • Benchmark WILDS — Coautorado (Koh et al., ICML 2021), o WILDS forneceu um benchmark rigoroso para mudança de distribuição em aprendizado de máquina em dez conjuntos de dados do mundo real, estabelecendo um padrão para avaliar a robustez a mudanças de implantação.

  • Predição de Vídeo para Interação Física — Publicado no NeurIPS 2016 (Finn, Goodfellow, Levine), este trabalho demonstrou que redes neurais poderiam aprender modelos diretos de cenas físicas a partir de vídeo bruto, permitindo o aprendizado não supervisionado de dinâmicas de interação robótica.


Prêmios e Reconhecimentos

  • Presidential Early Career Award for Scientists and Engineers (PECASE) (2025) — A mais alta honraria do governo dos Estados Unidos para cientistas e engenheiros em início de carreira.
  • Alfred P. Sloan Research Fellowship (2023) — Concedido a professores universitários excepcionais em início de carreira.
  • IEEE RAS Early Academic Career Award in Robotics and Automation (2022)
  • Office of Naval Research Young Investigator Award (2021)
  • Microsoft Research Faculty Fellowship (2020)
  • Samsung AI Researcher of the Year (2020) — Concedido a 19 pesquisadores de IA em início de carreira globalmente.
  • Intel Rising Star Faculty Award (2020) — Concedido a 7 professores universitários dos EUA em informação e telecomunicações.
  • ACM Doctoral Dissertation Award (2019) — O mais alto reconhecimento do ACM para uma tese de doutorado em computação; concedido por Learning to Learn with Gradients.
  • MIT Technology Review Innovators Under 35 — Pioneer (2018)
  • C.V. & Daulat Ramamoorthy Distinguished Research Award, UC Berkeley EECS (2016) — Primeira mulher a receber este prêmio.

Relacionamentos Chave

  • Sergey Levine — Co-orientador de doutorado em Berkeley; cofundador da Physical Intelligence; a colaboração de uma década de Finn e Levine abrange aprendizado de políticas visuomotoras, RL offline, transferência entre corporificações e a fundação da Pi; uma das parcerias de pesquisa mais produtivas em aprendizado robótico.
  • Pieter Abbeel — Co-orientador de doutorado em Berkeley; MAML foi coautorado com Abbeel; a ênfase de seu laboratório em meta-aprendizado e manipulação robótica moldou as contribuições fundamentais de Finn; também coautor em trabalhos iniciais sobre políticas visuomotoras.
  • Rafael Rafailov — Estudante de doutorado em Stanford cujo trabalho de tese Finn co-supervisionou; primeiro autor do DPO, um dos artigos de alinhamento mais impactantes de 2023.
  • Fei-Fei Li — Colega sênior de Stanford e afiliada docente do HAI; aparece entre os seguidores acadêmicos e rede profissional mais proeminentes de Finn; suas afiliações laboratoriais em Stanford se sobrepõem em percepção e aprendizado robótico.
  • Karol Hausman — Cofundador da Physical Intelligence; ex-pesquisador do Google Brain cujo trabalho em RT-2 e aprendizado robótico em larga escala convergiu diretamente com a agenda de Finn.
  • Tony Z. Zhao — Estudante de doutorado e contribuidor chave para o trabalho de manipulação ALOHA/Unleashed e móvel proveniente da rede mais ampla de Finn em Stanford.
  • Ian Goodfellow — Coautor no artigo de predição de vídeo do NeurIPS 2016; um colaborador inicial que aparece entre as conexões profissionais mais proeminentes de Finn.
  • Christopher Manning — Colega de Stanford e coautor no DPO; a colaboração exemplifica o engajamento interdisciplinar de Finn entre robótica e PLN em Stanford.

Estilo Pessoal

A pesquisa de Finn é caracterizada por uma forte preferência por algoritmos simples e gerais em detrimento daqueles projetados para domínios específicos — uma sensibilidade que produziu diretamente o design agnóstico ao modelo do MAML e a reformulação do RLHF como classificação supervisionada pelo DPO. A estruturação de seu laboratório de “inteligência através da interação robótica em escala” reflete a convicção de que a interação corporificada com o mundo físico é tanto o teste chave quanto o motor chave da inteligência geral. No design de cursos e divulgação, ela investiu substancialmente em tornar os métodos de pesquisa em nível de pós-graduação amplamente acessíveis — tanto através de séries de palestras de Stanford publicamente disponíveis quanto através de programas educacionais focados em diversidade em Berkeley. Sua comunicação pública é tecnicamente precisa e notavelmente discreta; ela tende a enquadrar novos resultados em termos de seus modos de falha e problemas em aberto restantes, em vez de superlativos.


Referências