Chelsea Finn

ref · 25 Mayo, 2026 06:26

Profesora Asistente de Ciencias de la Computación e Ingeniería Eléctrica en la Universidad de Stanford, inventora del Aprendizaje Meta-Agnóstico del Modelo (MAML), coautora de la Optimización de Preferencias Directas (DPO) y cofundadora de Physical Intelligence; una de las investigadoras de carrera temprana más citadas en aprendizaje automático y robótica.

Perfil

Campo	Detalle
Nacimiento	8 de octubre de 1992, Estados Unidos
Nacionalidad	Estadounidense
Instituciones Actuales	Universidad de Stanford (IRIS Lab); Physical Intelligence (Cofundadora)
Áreas de Investigación	Meta-aprendizaje, Aprendizaje robótico, Aprendizaje por refuerzo, Aprendizaje por imitación, Modelos Visión-Lenguaje-Acción
Asesores de Doctorado	Sergey Levine; Pieter Abbeel
Tesis Doctoral	Learning to Learn with Gradients (UC Berkeley, 2018)
Sitio web académico	ai.stanford.edu/~cbfinn
X / Twitter	@chelseabfinn
GitHub	@cbfinn
Google Scholar	scholar.google.com (más de 126 000 citas)

Resumen

Chelsea Finn es una científica informática estadounidense y una de las investigadoras más influyentes de su generación en la intersección del aprendizaje automático y la robótica. Es mejor conocida por inventar el Aprendizaje Meta-Agnóstico del Modelo (MAML, por sus siglas en inglés), un algoritmo basado en gradientes publicado en ICML 2017 que se convirtió en uno de los artículos más citados de la década y estableció el meta-aprendizaje como una dirección de investigación importante. Como coautora de la Optimización de Preferencias Directas (DPO, NeurIPS 2023), contribuyó con una segunda técnica de gran impacto, esta vez para la alineación de modelos de lenguaje, que rápidamente desplazó a los enfoques basados en RLHF tanto en entornos académicos como industriales. Finn dirige el IRIS Lab (Intelligence through Robotic Interaction at Scale) en Stanford, donde ocupa puestos conjuntos en Ciencias de la Computación e Ingeniería Eléctrica como Profesora Asistente William George e Ida Mary Hoover. En 2024 cofundó Physical Intelligence (Pi), una empresa de robótica basada en IA que recaudó 400 millones de dólares con una valoración de 2 800 millones de dólares y está desarrollando modelos fundacionales de propósito general para robots físicos. Ha acumulado más de 126 000 citas en Google Scholar, una cifra excepcional para una investigadora que completó su doctorado en 2018.

Primeros Años y Educación

Licenciatura en Ingeniería Eléctrica y Ciencias de la Computación — Instituto Tecnológico de Massachusetts (MIT)
Finn completó su carrera universitaria en el MIT en EECS, construyendo la base técnica en aprendizaje automático y sistemas de control que enmarcaría su investigación de posgrado.

Doctorado en Ciencias de la Computación — Universidad de California, Berkeley, 2018
Finn se unió al Laboratorio de Investigación de Inteligencia Artificial de Berkeley (BAIR), bajo la supervisión conjunta de Sergey Levine y Pieter Abbeel. Su tesis, Learning to Learn with Gradients, desarrolló el marco teórico y algorítmico para el meta-aprendizaje basado en gradientes: la idea de que los parámetros de un modelo pueden optimizarse para servir como una excelente inicialización para una adaptación rápida a nuevas tareas mediante un pequeño número de pasos de gradiente. La tesis recibió el Premio ACM a la Tesis Doctoral, el mayor reconocimiento del campo para una tesis doctoral. Fue la primera mujer en recibir el Premio de Investigación Distinguida C.V. y Daulat Ramamoorthy de UC Berkeley EECS (2016), otorgado por una investigación excepcional durante los estudios de doctorado. Durante su doctorado también realizó prácticas en Google Brain, trabajando en aprendizaje robótico a gran escala a partir de modelos predictivos profundos.

Carrera

UC Berkeley — BAIR Lab (2014–2018)

Como estudiante de doctorado bajo la supervisión de Levine y Abbeel, Finn desarrolló los métodos que definirían su reputación temprana: aprendizaje de extremo a extremo de políticas visomotoras, predicción de video para interacción física y, lo más significativo, el algoritmo MAML. Junto con su investigación doctoral, coimpartió un curso pionero sobre aprendizaje por refuerzo profundo (UC Berkeley CS294-112, primavera de 2017), coorganizó un taller sobre aprendizaje profundo para la acción y la interacción en NeurIPS 2016, y coorganizó BAIR Camp, un campamento de verano de divulgación para estudiantes de secundaria de entornos de bajos ingresos.

Google Brain — Prácticas (2016–2017)

Durante su doctorado, Finn trabajó como investigadora en prácticas en Google Brain, contribuyendo a proyectos de aprendizaje robótico que implicaban el entrenamiento de modelos predictivos a gran escala y conjuntos de datos de agarre robótico, varios de los cuales se publicaron públicamente como el corpus de datos de Google Brain Robotics.

Universidad de Stanford — IRIS Lab (2019–presente)

Finn se unió a Stanford como profesora asistente en 2019. Ocupa puestos conjuntos en Ciencias de la Computación e Ingeniería Eléctrica y está afiliada a Stanford HAI y al Stanford ML Group. Su laboratorio, IRIS (Intelligence through Robotic Interaction at Scale), realiza investigaciones en cuatro temas: aprendizaje a partir de datos fuera de línea y demostraciones, meta-aprendizaje y generalización, modelos visión-lenguaje-acción, y despliegue de robots en el mundo real.

CS330: Aprendizaje Multitarea Profundo y Metaaprendizaje — Finn diseñó e impartió este curso de Stanford a partir del otoño de 2019; los videos de las conferencias de múltiples ediciones están disponibles públicamente y han sido ampliamente adoptados como un plan de estudios estándar para el estudio de meta-aprendizaje a nivel de posgrado a nivel mundial.

CS224R: Aprendizaje por Refuerzo Profundo — Finn también imparte este curso de Stanford, que cubre métodos modernos de aprendizaje por refuerzo profundo y su aplicación al control robótico.

Líneas de investigación clave en Stanford:

Durante su mandato como profesora, el laboratorio de Finn ha contribuido a varias líneas de investigación distintas. En meta-aprendizaje y generalización, el trabajo sobre robustez fuera de la distribución y cambio de distribución (incluido el punto de referencia WILDS, ICML 2021) amplió sus contribuciones de la era del doctorado al problema más amplio del aprendizaje automático robusto. En aprendizaje robótico, su grupo ha trabajado en aprendizaje por refuerzo fuera de línea y en línea para robótica, transferencia entre cuerpos (serie Bridge Data) e imitación humanoide (HumanPlus, 2024). Más recientemente, OpenVLA (2024), un modelo de visión-lenguaje-acción de código abierto desarrollado conjuntamente con colaboradores de Stanford y Berkeley, estableció un nuevo estándar abierto para el control robótico generalista. En modelos de lenguaje, DPO (2023) se convirtió en una de las contribuciones más importantes a la metodología de alineación de LLM en los últimos años.

Physical Intelligence (Pi) — Cofundadora (2024–presente)

En 2024, Finn cofundó Physical Intelligence junto con Sergey Levine, Karol Hausman, Brian Ichter, Lachy Groom, Adnan Esmail y Quan Vuong. La tesis de la empresa —que un único modelo fundacional grande puede aprender a controlar cualquier robot para cualquier tarea, de manera análoga a cómo los grandes modelos de lenguaje se generalizaron en el texto— refleja directamente el programa de investigación que Finn y Levine desarrollaron durante una década. Physical Intelligence ha recaudado 400 millones de dólares con una valoración de 2 800 millones de dólares, con el respaldo de Bezos Expeditions, Khosla Ventures y el Fondo de Startups de OpenAI. El primer modelo público de la empresa, π0 (pi-zero), es un modelo de visión-lenguaje-acción que demuestra manipulación diestra generalista en múltiples plataformas robóticas.

Contribuciones Clave

Aprendizaje Meta-Agnóstico del Modelo (MAML) — Presentado en ICML 2017 (Finn, Abbeel, Levine), MAML introdujo un algoritmo de meta-aprendizaje basado en gradientes que optimiza los parámetros iniciales del modelo para una adaptación rápida a nuevas tareas con datos mínimos. Su diseño agnóstico del modelo significaba que se aplicaba a cualquier modelo entrenado con gradientes — clasificación, regresión o aprendizaje por refuerzo — y se convirtió en uno de los artículos fundacionales de la literatura sobre meta-aprendizaje, acumulando decenas de miles de citas y generando docenas de variantes algorítmicas, incluyendo Reptile, FOMAML e iMAML.
Políticas Visomotoras Profundas de Extremo a Extremo — Publicado en JMLR 2016 (Levine, Finn, Darrell, Abbeel), este artículo demostró que las redes neuronales profundas podían aprender políticas de manipulación robótica de extremo a extremo a partir de imágenes de cámara y ángulos de articulación, uniendo la percepción visual y el control motor en un único sistema diferenciable.
Optimización de Preferencias Directas (DPO) — Publicado en NeurIPS 2023 (Rafailov, Sharma, Mitchell, Ermon, Manning, Finn), DPO reformuló el objetivo de aprendizaje de preferencias de RLHF como un problema de clasificación binaria supervisado, eliminando la necesidad de un modelo de recompensa separado y las inestabilidades del ajuste fino basado en PPO. Fue adoptado casi inmediatamente tanto en la comunidad de investigación como en la industria, y ha acumulado citas a una de las tasas más rápidas en la historia reciente de NeurIPS. Finn actuó como coautora principal, proporcionando la infraestructura del laboratorio y la dirección de la investigación.
CS330: Aprendizaje Multitarea Profundo y Metaaprendizaje — Este curso de posgrado de Stanford creado por Finn en 2019 se convirtió en el plan de estudios universitario principal para el meta-aprendizaje y el aprendizaje multitarea a nivel mundial; sus conferencias en video publicadas públicamente han llegado a profesionales e investigadores más allá de la matrícula de Stanford.
OpenVLA: Un Modelo de Visión-Lenguaje-Acción de Código Abierto — Publicado en CoRL 2024 (Kim, Pertsch, Karamcheti, et al., co-supervisado por Finn y colaboradores), OpenVLA estableció una línea base gratuita y reproducible para el control robótico generalista que democratizó el acceso a la investigación de VLA para la comunidad en general.
Open X-Embodiment y RT-X — Finn formó parte del gran equipo colaborativo (ICRA 2024) que ensambló el conjunto de datos Open X-Embodiment que abarca 22 formas robóticas y 527 habilidades, permitiendo el aprendizaje de transferencia entre cuerpos y publicándolo públicamente; un paso emblemático hacia modelos fundacionales robóticos generalizables.
HumanPlus: Sombreado e Imitación Humanoide — Publicado en CoRL 2024 (Fu, Zhao, Wu, Wetzstein, Finn), este trabajo demostró el aprendizaje de la manipulación humanoide de cuerpo completo a partir de la captura de movimiento humano mediante una combinación de aprendizaje por imitación y aprendizaje por refuerzo.
Punto de Referencia WILDS — Coautoría (Koh et al., ICML 2021), WILDS proporcionó un punto de referencia riguroso para el cambio de distribución en el aprendizaje automático en diez conjuntos de datos del mundo real, estableciendo un estándar para evaluar la robustez a los cambios de implementación.
Predicción de Video para Interacción Física — Publicado en NeurIPS 2016 (Finn, Goodfellow, Levine), este trabajo demostró que las redes neuronales podían aprender modelos prospectivos de escenas físicas a partir de video en bruto, permitiendo el aprendizaje no supervisado de la dinámica de interacción robótica.

Premios y Reconocimientos

Premio Presidencial de Carrera Temprana para Científicos e Ingenieros (PECASE) (2025) — El mayor honor del gobierno de los Estados Unidos para científicos e ingenieros de carrera temprana.
Beca de Investigación Alfred P. Sloan (2023) — Otorgada a profesores de carrera temprana excepcionales.
Premio IEEE RAS a la Carrera Académica Temprana en Robótica y Automatización (2022)
Premio Joven Investigador de la Oficina de Investigación Naval (2021)
Beca de Facultad de Microsoft Research (2020)
Investigador del Año en IA de Samsung (2020) — Otorgado a 19 investigadores de IA de carrera temprana a nivel mundial.
Premio Intel Rising Star Faculty (2020) — Otorgado a 7 profesores estadounidenses en información y telecomunicaciones.
Premio ACM a la Tesis Doctoral (2019) — El mayor reconocimiento del ACM para una tesis doctoral en computación; otorgado por Learning to Learn with Gradients.
Innovadores Menores de 35 del MIT Technology Review — Pionera (2018)
Premio de Investigación Distinguida C.V. y Daulat Ramamoorthy, UC Berkeley EECS (2016) — Primera mujer en recibir este premio.

Relaciones Clave

Sergey Levine — Coasesor de doctorado en Berkeley; cofundador de Physical Intelligence; la colaboración de una década de Finn y Levine abarca el aprendizaje de políticas visomotoras, aprendizaje por refuerzo fuera de línea, transferencia entre cuerpos y la fundación de Pi; una de las asociaciones de investigación más productivas en aprendizaje robótico.
Pieter Abbeel — Coasesor de doctorado en Berkeley; MAML fue coautor con Abbeel; el énfasis de su laboratorio en el meta-aprendizaje y la manipulación robótica dio forma a las contribuciones fundacionales de Finn; también coautor en el trabajo temprano sobre políticas visomotoras.
Rafael Rafailov — Estudiante de doctorado en Stanford cuyo trabajo de tesis Finn co-supervisó; primer autor de DPO, uno de los artículos de alineación más impactantes de 2023.
Fei-Fei Li — Colega senior de Stanford y miembro afiliado de la facultad de HAI; aparece entre los seguidores académicos más prominentes de Finn y su red profesional; sus afiliaciones de laboratorio en Stanford se superponen en percepción robótica y aprendizaje.
Karol Hausman — Cofundador de Physical Intelligence; ex investigador de Google Brain cuyo trabajo sobre RT-2 y aprendizaje robótico a gran escala convergió directamente con la agenda de Finn.
Tony Z. Zhao — Estudiante de doctorado y contribuyente clave en el trabajo de ALOHA/Unleashed y manipulación móvil que surge de la red más amplia de Finn en Stanford.
Ian Goodfellow — Coautor en el artículo de 2016 de NeurIPS sobre predicción de video; un colaborador temprano que aparece entre las conexiones profesionales más prominentes de Finn.
Christopher Manning — Colega de Stanford y coautor en DPO; la colaboración ejemplifica el compromiso interdisciplinario de Finn entre robótica y PNL en Stanford.

Estilo Personal

La investigación de Finn se caracteriza por una fuerte preferencia por algoritmos simples y generales sobre aquellos diseñados para dominios específicos, una sensibilidad que produjo directamente el diseño agnóstico del modelo de MAML y la reformulación de DPO de RLHF como clasificación supervisada. El marco de su laboratorio de “inteligencia a través de la interacción robótica a escala” refleja la convicción de que la interacción incorporada con el mundo físico es tanto la prueba clave como el motor clave de la inteligencia general. En el diseño de cursos y la divulgación, ha invertido sustancialmente en hacer que los métodos de investigación de posgrado sean ampliamente accesibles, tanto a través de series de conferencias de Stanford publicadas públicamente como a través de programas educativos centrados en la diversidad en Berkeley. Su comunicación pública es técnicamente precisa y notablemente libre de exageraciones; tiende a enmarcar los nuevos resultados en términos de sus modos de fallo y problemas abiertos restantes en lugar de superlativos.