Chelsea Finn

ref · 25. Mai 2026 um 06:26

Assistenzprofessor für Informatik und Elektrotechnik an der Stanford University, Erfinder des Model-Agnostic Meta-Learning (MAML), Ko-Autor von Direct Preference Optimization (DPO) und Mitbegründer von Physical Intelligence — einer der am häufigsten zitierten Nachwuchsforscher im Bereich maschinelles Lernen und Robotik.

Profil

Bereich	Details
Geboren	8. Oktober 1992, USA
Staatsangehörigkeit	US-Amerikaner
Derzeitige Einrichtungen	Stanford University (IRIS Lab); Physical Intelligence (Mitbegründer)
Forschungsbereiche	Meta-Learning, Roboterlernen, Bestärkendes Lernen, Imitationslernen, Vision-Language-Action-Modelle
Doktorväter	Sergey Levine; Pieter Abbeel
Doktorarbeit	Learning to Learn with Gradients (UC Berkeley, 2018)
Akademische Website	ai.stanford.edu/~cbfinn
X / Twitter	@chelseabfinn
GitHub	@cbfinn
Google Scholar	scholar.google.com (über 126.000 Zitationen)

Überblick

Chelsea Finn ist eine US-amerikanische Informatikerin und eine der einflussreichsten Forscherinnen ihrer Generation an der Schnittstelle von maschinellem Lernen und Robotik. Sie ist vor allem für die Entwicklung des Model-Agnostic Meta-Learning (MAML) bekannt, einem gradientenbasierten Algorithmus, der 2017 auf dem ICML veröffentlicht wurde, zu den am häufigsten zitierten Arbeiten des Jahrzehnts zählt und Meta-Learning als bedeutende Forschungsrichtung etablierte. Als Ko-Autorin von Direct Preference Optimization (DPO, NeurIPS 2023) trug sie eine zweite hochwirksame Technik zur Ausrichtung von Sprachmodellen bei, die in akademischen und industriellen Umgebungen schnell auf RLHF basierende Ansätze verdrängte. Finn leitet das IRIS Lab (Intelligence through Robotic Interaction at Scale) an der Stanford University, wo sie als William George and Ida Mary Hoover Faculty Fellow gemeinsam in den Fachbereichen Informatik und Elektrotechnik berufen ist. 2024 gründete sie Physical Intelligence (Pi) mit, ein Robotik-KI-Unternehmen, das 400 Millionen US-Dollar bei einer Bewertung von 2,8 Milliarden US-Dollar einsammelte und universelle Grundlagenmodelle für physische Roboter entwickelt. Sie hat über 126.000 Google-Scholar-Zitationen angesammelt — eine außergewöhnliche Zahl für eine Forscherin, die ihre Promotion 2018 abschloss.

Frühes Leben & Ausbildung

B.S., Elektrotechnik und Informatik — Massachusetts Institute of Technology
Finn absolvierte ihr Grundstudium am MIT in EECS und legte so die technische Grundlage in maschinellem Lernen und Regelungssystemen, die ihre spätere Forschung prägen sollte.

Ph.D., Informatik — University of California, Berkeley, 2018
Finn trat dem Berkeley Artificial Intelligence Research Lab (BAIR) bei, wo sie gemeinsam von Sergey Levine und Pieter Abbeel betreut wurde. Ihre Dissertation Learning to Learn with Gradients entwickelte den theoretischen und algorithmischen Rahmen für gradientenbasiertes Meta-Learning — die Idee, dass die Parameter eines Modells so optimiert werden können, dass sie als hervorragende Initialisierung für die schnelle Anpassung an neue Aufgaben durch eine kleine Anzahl von Gradientenschritten dienen. Die Dissertation erhielt den ACM Doctoral Dissertation Award, die höchste Auszeichnung des Fachgebiets für eine Doktorarbeit. Sie war die erste Frau, die den C.V. & Daulat Ramamoorthy Distinguished Research Award (2016) der UC Berkeley EECS erhielt, der für herausragende Forschung während der Promotion vergeben wird. Während ihrer Promotion war sie auch Praktikantin bei Google Brain, wo sie an groß angelegtem Roboterlernen aus tiefen prädiktiven Modellen arbeitete.

Karriere

UC Berkeley — BAIR Lab (2014–2018)

Als Doktorandin unter Levine und Abbeel entwickelte Finn die Methoden, die ihren frühen Ruf prägten: End-to-End-Lernen visuomotorischer Strategien, Videovorhersage für physische Interaktion und — am bedeutendsten — den MAML-Algorithmus. Neben ihrer Doktorandenforschung war sie Mitdozentin eines wegweisenden Kurses über tiefes bestärkendes Lernen (UC Berkeley CS294-112, Frühjahr 2017), Mitorganisatorin eines Workshops über tiefes Lernen für Aktion und Interaktion auf dem NeurIPS 2016 und Mitorganisatorin des BAIR Camp, eines Outreach-Sommercamps für Gymnasiasten aus einkommensschwachen Familien.

Google Brain — Praktikum (2016–2017)

Während ihrer Promotion arbeitete Finn als Forschungspraktikantin bei Google Brain und trug zu Roboterlernprojekten bei, die das Training groß angelegter prädiktiver Modelle und Robotergreifdatensätze umfassten, von denen mehrere öffentlich als der Google Brain Robotics Data-Korpus veröffentlicht wurden.

Stanford University — IRIS Lab (2019–heute)

Finn trat 2019 als Assistenzprofessor in Stanford ein. Sie hat gemeinsame Berufungen in den Fachbereichen Informatik und Elektrotechnik inne und ist assoziiert mit Stanford HAI und der Stanford ML Group. Ihr Labor, IRIS (Intelligence through Robotic Interaction at Scale), forscht zu vier Themen: Lernen aus Offline-Daten und Demonstrationen, Meta-Learning und Generalisierung, Vision-Language-Action-Modelle und Einsatz von Robotern in der realen Welt.

CS330: Deep Multi-task and Meta Learning — Finn entwarf und unterrichtete diesen Stanford-Kurs ab Herbst 2019; Vorlesungsvideos mehrerer Auflagen sind öffentlich verfügbar und wurden weltweit als Standardcurriculum für das Meta-Learning-Studium auf Graduiertenniveau übernommen.

CS224R: Deep Reinforcement Learning — Finn unterrichtet auch diesen Stanford-Kurs, der moderne Deep-RL-Methoden und deren Anwendung auf die Robotersteuerung behandelt.

Wichtige Forschungsstränge in Stanford:

Während ihrer Zeit als Professorin hat Finns Labor zu mehreren verschiedenen Forschungssträngen beigetragen. Im Bereich Meta-Learning und Generalisierung erweiterte die Arbeit zur Robustheit gegenüber Verteilungsverschiebungen (einschließlich des WILDS-Benchmarks, ICML 2021) ihre Beiträge aus der Promotionszeit auf das breitere Problem des robusten maschinellen Lernens. Im Bereich Roboterlernen hat ihre Gruppe an Offline- und Online-RL für die Robotik, dem Transfer zwischen verschiedenen Roboterplattformen (Bridge Data-Serie) und der humanoiden Imitation (HumanPlus, 2024) gearbeitet. Am jüngsten ist OpenVLA (2024) — ein quelloffenes Vision-Language-Action-Modell, das gemeinsam mit Mitarbeitern in Stanford und Berkeley entwickelt wurde und einen neuen offenen Standard für die generalistische Robotersteuerung setzte. Im Bereich Sprachmodelle wurde DPO (2023) zu einem der folgenreichsten Beiträge zur LLM-Ausrichtungsmethodik der letzten Jahre.

Physical Intelligence (Pi) — Mitbegründerin (2024–heute)

2024 gründete Finn Physical Intelligence gemeinsam mit Sergey Levine, Karol Hausman, Brian Ichter, Lachy Groom, Adnan Esmail und Quan Vuong. Die These des Unternehmens — dass ein einzelnes großes Grundlagenmodell lernen kann, jeden Roboter für jede Aufgabe zu steuern, analog dazu, wie große Sprachmodelle über Texte hinweg generalisierten — spiegelt direkt das Forschungsprogramm wider, das Finn und Levine über ein Jahrzehnt entwickelt haben. Physical Intelligence hat 400 Millionen US-Dollar bei einer Bewertung von 2,8 Milliarden US-Dollar eingesammelt, mit Unterstützung von Bezos Expeditions, Khosla Ventures und dem OpenAI Startup Fund. Das erste öffentliche Modell des Unternehmens, π0 (pi-zero), ist ein Vision-Language-Action-Modell, das generalistische geschickte Manipulation über mehrere Roboterplattformen hinweg demonstriert.

Wichtige Beiträge

Model-Agnostic Meta-Learning (MAML) — Vorgestellt auf dem ICML 2017 (Finn, Abbeel, Levine), führte MAML einen gradientenbasierten Meta-Learning-Algorithmus ein, der initiale Modellparameter für die schnelle Anpassung an neue Aufgaben mit minimalen Daten optimiert. Sein modellunabhängiges Design bedeutete, dass es auf jedes gradiententrainierte Modell anwendbar war — Klassifikation, Regression oder bestärkendes Lernen — und es wurde zu einem der grundlegenden Arbeiten der Meta-Learning-Literatur, das Zehntausende von Zitationen anhäufte und Dutzende algorithmischer Varianten hervorbrachte, darunter Reptile, FOMAML und iMAML.
End-to-End Deep Visuomotor Policies — Veröffentlicht im JMLR 2016 (Levine, Finn, Darrell, Abbeel), zeigte diese Arbeit, dass tiefe neuronale Netze Roboter-Manipulationsstrategien End-to-End aus Kamerabildern und Gelenkwinkeln lernen konnten, wobei visuelle Wahrnehmung und motorische Steuerung in einem einzigen differenzierbaren System verbunden wurden.
Direct Preference Optimization (DPO) — Veröffentlicht auf dem NeurIPS 2023 (Rafailov, Sharma, Mitchell, Ermon, Manning, Finn), formte DPO das RLHF-Präferenzlernziel als überwachtes binäres Klassifikationsproblem um und eliminierte die Notwendigkeit eines separaten Belohnungsmodells und die Instabilitäten des PPO-basierten Feintunings. Es wurde fast sofort sowohl in der Forschungsgemeinschaft als auch in der Industrie übernommen und hat sich mit einer der schnellsten Raten in der jüngeren NeurIPS-Geschichte zitiert. Finn war leitende Ko-Autorin, die die Laborinfrastruktur und Forschungsrichtung bereitstellte.
CS330: Deep Multi-task and Meta Learning — Dieser von Finn 2019 geschaffene Stanford-Graduiertenkurs wurde zum primären universitären Curriculum für Meta-Learning und Multi-Task-Learning weltweit; seine öffentlich zugänglichen Vorlesungsvideos haben Praktiker und Forscher weit über die Stanford-Immatrikulation hinaus erreicht.
OpenVLA: Ein quelloffenes Vision-Language-Action-Modell — Veröffentlicht auf dem CoRL 2024 (Kim, Pertsch, Karamcheti, et al., gemeinsam betreut von Finn und Mitarbeitern), etablierte OpenVLA eine frei verfügbare, reproduzierbare Baseline für die generalistische Robotersteuerung, die den Zugang zur VLA-Forschung für die breitere Gemeinschaft demokratisierte.
Open X-Embodiment und RT-X — Finn war Teil des großen kollaborativen Teams (ICRA 2024), das den Open X-Embodiment-Datensatz zusammenstellte, der 22 Roboterplattformen und 527 Fähigkeiten umfasst, den Transfer zwischen Robotertypen ermöglicht und ihn öffentlich freigegeben hat; ein Meilenstein auf dem Weg zu generalisierbaren Roboter-Grundlagenmodellen.
HumanPlus: Humanoide Nachahmung und Imitation — Veröffentlicht auf dem CoRL 2024 (Fu, Zhao, Wu, Wetzstein, Finn), demonstrierte diese Arbeit das Erlernen der Ganzkörper-Manipulation humanoider Roboter aus menschlicher Bewegungserfassung durch eine Kombination von Imitationslernen und bestärkendem Lernen.
WILDS Benchmark — Mitverfasst (Koh et al., ICML 2021), bot WILDS einen rigorosen Benchmark für Verteilungsverschiebungen im maschinellen Lernen über zehn reale Datensätze hinweg und etablierte einen Standard für die Bewertung der Robustheit gegenüber Verschiebungen bei der Bereitstellung.
Videovorhersage für physische Interaktion — Veröffentlicht auf dem NeurIPS 2016 (Finn, Goodfellow, Levine), zeigte diese Arbeit, dass neuronale Netze Vorwärtsmodelle physischer Szenen aus Rohvideo lernen konnten, was unüberwachtes Lernen von Roboter-Interaktionsdynamiken ermöglichte.

Auszeichnungen & Ehrungen

Presidential Early Career Award for Scientists and Engineers (PECASE) (2025) — Die höchste Auszeichnung der US-Regierung für Nachwuchswissenschaftler und -ingenieure.
Alfred P. Sloan Research Fellowship (2023) — Vergeben an herausragende Nachwuchsprofessoren.
IEEE RAS Early Academic Career Award in Robotics and Automation (2022)
Office of Naval Research Young Investigator Award (2021)
Microsoft Research Faculty Fellowship (2020)
Samsung AI Researcher of the Year (2020) — Vergeben an 19 Nachwuchs-KI-Forscher weltweit.
Intel Rising Star Faculty Award (2020) — Vergeben an 7 US-Professoren im Bereich Information und Telekommunikation.
ACM Doctoral Dissertation Award (2019) — Die höchste Anerkennung der ACM für eine Doktorarbeit in der Informatik; verliehen für Learning to Learn with Gradients.
MIT Technology Review Innovators Under 35 — Pioneer (2018)
C.V. & Daulat Ramamoorthy Distinguished Research Award, UC Berkeley EECS (2016) — Erste Frau, die diesen Preis erhielt.

Wichtige Beziehungen

Sergey Levine — Doktorvater in Berkeley; Mitbegründer von Physical Intelligence; Finns und Levines jahrzehntelange Zusammenarbeit umfasst visuomotorisches Policylernen, Offline-RL, roboterübergreifenden Transfer und die Gründung von Pi; eines der produktivsten Forschungspartnerschaften im Roboterlernen.
Pieter Abbeel — Doktorvater in Berkeley; MAML wurde mit Abbeel verfasst; der Schwerpunkt seines Labors auf Meta-Learning und robotischer Manipulation prägte Finns grundlegende Beiträge; auch Ko-Autor früher visuomotorischer Policy-Arbeiten.
Rafael Rafailov — Doktorand in Stanford, dessen Dissertationsarbeit Finn mitbetreute; Erstautor von DPO, einem der einflussreichsten Ausrichtungspapiere des Jahres 2023.
Fei-Fei Li — Ältere Stanford-Kollegin und Fakultätsmitglied des HAI; gehört zu Finns prominentesten akademischen Anhängern und professionellem Netzwerk; ihre Laboraffiliationen in Stanford überschneiden sich in den Bereichen Robotik-Wahrnehmung und Lernen.
Karol Hausman — Mitbegründer von Physical Intelligence; ehemaliger Google-Brain-Forscher, dessen Arbeiten zu RT-2 und groß angelegtem Roboterlernen direkt mit Finns Agenda konvergierten.
Tony Z. Zhao — Doktorand und wichtiger Beitragender zu den ALOHA/Unleashed- und mobilen Manipulationsarbeiten aus Finns breiterem Stanford-Netzwerk.
Ian Goodfellow — Ko-Autor der NeurIPS-Videovorhersagearbeit von 2016; ein früher Kollaborateur, der zu Finns prominentesten beruflichen Verbindungen zählt.
Christopher Manning — Stanford-Kollege und Ko-Autor von DPO; die Zusammenarbeit veranschaulicht Finns interdisziplinäres Engagement zwischen Robotik und NLP in Stanford.

Persönlicher Stil

Finns Forschung zeichnet sich durch eine starke Vorliebe für einfache, allgemeine Algorithmen aus, statt für solche, die für bestimmte Bereiche entwickelt wurden – eine Empfindung, die unmittelbar MAMLs modellunabhängiges Design und DPOs Umformulierung von RLHF als überwachte Klassifikation hervorbrachte. Die Rahmung ihres Labors als „Intelligenz durch robotische Interaktion im Maßstab“ spiegelt die Überzeugung wider, dass verkörperte Interaktion mit der physikalischen Welt sowohl der entscheidende Test als auch der entscheidende Treiber allgemeiner Intelligenz ist. In der Kursgestaltung und Öffentlichkeitsarbeit hat sie erheblich investiert, um Graduierten-Forschungsmethoden weit zugänglich zu machen – sowohl durch öffentlich zugängliche Stanford-Vorlesungsreihen als auch durch diversitätsorientierte Bildungsprogramme in Berkeley. Ihre öffentliche Kommunikation ist technisch präzise und bemerkenswert hype-frei; sie neigt dazu, neue Ergebnisse hinsichtlich ihrer Fehlermodi und verbleibenden offenen Probleme zu rahmen, anstatt sie mit Superlativen zu überhöhen.