Lilian Weng

Бывший вице-президент по исследованиям и безопасности в OpenAI, сооснователь Thinking Machines Lab и автор Lil’Log — самого читаемого технического ML-блога в своей области, который ведется с 2017 года как личные учебные заметки и стал стандартным справочником в сообществе ИИ.


Профиль

Поле Детали
Национальность Китайско-американка
Текущая роль Сооснователь, Thinking Machines Lab; выдающийся научный сотрудник, Fellows Fund
Области исследований Безопасность ИИ, обучение с подкреплением, согласование LLM, хакерство вознаграждений, автономные агенты, робототехника
Образование Бакалавр компьютерных наук (Китай); доктор компьютерных наук (США) — см. примечание
Блог Lil’Log — lilianweng.github.io
X / Twitter @lilianweng
GitHub @lilianweng
Google Scholar scholar.google.com — более 48 000 цитирований

Примечание об образовании: Источники расходятся в деталях. Согласно одному профилю, она получила степень бакалавра в Бэйханском университете и докторскую степень в Университете Карнеги-Меллон; согласно другому — бакалавра в Пекинском университете и докторскую степень в Университете Индианы в Блумингтоне. Ни один из этих фактов не был подтвержден первоисточником. Ее докторские исследования охватывали обучение с подкреплением, робототехнику и науку о сетях.


Общая информация

Лилиан Вэн — китайско-американский исследователь в области безопасности ИИ и один из самых влиятельных авторов в этой сфере, наиболее известный благодаря двум параллельным направлениям, которые усиливали друг друга на протяжении семи лет работы в OpenAI: ее техническому руководству при построении инфраструктуры безопасности компании и ее блогу Lil’Log, который она ведет с 2017 года как личные учебные заметки и который стал самым читаемым техническим ML-блогом среди практикующих специалистов. Она присоединилась к OpenAI в 2017/2018 году в команду робототехники, работала над проектом по манипуляции кубиком Рубика, перешла в прикладные исследования ИИ, возглавила команду Safety Systems (более 80 ученых) и была назначена вице-президентом по исследованиям и безопасности в июле 2024 года — до своего ухода в ноябре 2024 года. Business Insider назвал ее в числе 2024 AI Power List. Она является сооснователем Thinking Machines Lab, AI-стартапа Миры Мурати, вместе с Джоном Шульманом, Барретом Зофом, Алеком Рэдфордом и другими. Она описывает “настойчивость” и “скромность” как свои основные черты, обе из которых уходят корнями в раннее участие в математических олимпиадах, где она столкнулась с реальностью неравенства талантов и научилась подходить к сложным задачам как “обычный человек, который должен выложиться по полной”.


Ранние годы и образование

Вэн выросла в Китае, где рано проявила интерес к математике и всепоглощающее любопытство ко многим предметам — она рассказывала, что в детстве с жадностью читала энциклопедии, от астрономии до астрологии. С юных лет она участвовала в математических олимпиадах — опыт, который, по ее словам, сформировал ту “скромность”, которая характеризует ее работу: столкнувшись с крутыми кривыми таланта, она усвоила, что постоянные усилия и ясное мышление важнее врожденного преимущества.

Она получила степень бакалавра компьютерных наук в Китае (по одной информации — в Бэйханском университете, по другой — в Пекинском университете), а затем докторскую степень по компьютерным наукам в США, с исследованиями в области обучения с подкреплением, робототехники и науки о сетях. Ее интерес к глубокому обучению, с которым она познакомилась уже после докторской диссертации, разжег то любопытство, которое в конечном итоге привело ее в OpenAI.


Карьера

Опыт работы в индустрии до OpenAI

До прихода в OpenAI Вэн работала специалистом по данным и инженером-программистом в нескольких компаниях Кремниевой долины, включая Meta (тогда Facebook), Dropbox и Affirm. Она также, как сообщается, занимала должность научного сотрудника в Snapchat. Этот практический инженерный опыт — создание ML-систем в производственных средах до прихода в исследовательскую лабораторию ИИ — сформировал ее отчетливо прикладной подход к вопросам безопасности и согласования: она последовательно рассматривала безопасность не как теоретическую проблему, а как инженерную задачу создания продукта.

OpenAI (конец 2017 / 2018–2024)

Команда робототехники (2018–2021)
Первой ролью Вэн в OpenAI была работа в команде робототехники над одними из самых сложных физических задач ИИ в ранней истории компании. Флагманским проектом была система ловкого манипулирования кубиком Рубика — многолетняя попытка обучить роботизированную руку с помощью обучения с подкреплением собирать головоломку, публично продемонстрированная в 2019 году с использованием рандомизации среды в сотнях симулированных конфигураций для достижения переноса на физического робота. Она описывала эмоциональную напряженность аппаратных исследований: “проведение физических экспериментов — это чрезвычайно захватывающий, сложный и эмоциональный опыт”. Период работы в робототехнике заложил основу для ее последующей работы по безопасности, дав практическое понимание режимов отказа обучения с подкреплением, хакерства вознаграждений и разрыва между симуляцией и физическим развертыванием.

Команда прикладных исследований ИИ (2021–2023)
В 2021 году Вэн перешла в команду прикладных исследований ИИ OpenAI, где руководила исследованиями, связывающими новые возможности языковых моделей компании с прикладными приложениями. Этот период совпал с разработкой ChatGPT и GPT-4 и требовал сочетания исследовательского понимания поведения моделей с прикладной инженерной перспективой, чтобы сделать системы надежными и безопасными в контекстах взаимодействия с пользователями.

Руководитель команды Safety Systems (2023–2024)
В 2023 году Вэн было поручено возглавить команду Safety Systems OpenAI — на пике своей численности она насчитывала более 80 ученых, исследователей и экспертов по политике. Мандат команды заключался в защите от рисков, связанных с передовыми моделями, включая состязательные атаки, взломы (jailbreaks), хакерство вознаграждений при обучении с подкреплением на основе обратной связи от человека (RLHF) и оценку сценариев катастрофических рисков. Она также входила в комитет по безопасности и защите совета директоров, что давало ей формальные полномочия институционального надзора за решениями в области безопасности на самом высоком уровне структуры управления OpenAI.

Вице-президент по исследованиям и безопасности (июль–ноябрь 2024)
После ухода предыдущего руководителя по безопасности Александра Мондри, Вэн была назначена вице-президентом по исследованиям и безопасности в июле 2024 года, объединив исследования в области безопасности в OpenAI под единым руководством. В ее мандат входило как управление существующими системами безопасности, так и расширение оценок готовности к будущим моделям. Это назначение произошло на фоне более широкой волны уходов сотрудников, занимающихся безопасностью, из OpenAI, включая Яна Лайке, Джона Шульмана и Миру Мурати.

15 ноября 2024 года Вэн объявила о своем уходе в X: “После 7 лет в OpenAI я чувствую себя готовой сбросить скорость и исследовать что-то новое. Я приняла чрезвычайно трудное решение покинуть OpenAI. Глядя на то, чего мы достигли, я очень горжусь всеми в команде Safety Systems и чрезвычайно уверена, что команда продолжит процветать”.

Thinking Machines Lab — сооснователь (2025–настоящее время)

Вэн является сооснователем Thinking Machines Lab, запущенной бывшим техническим директором OpenAI Мирой Мурати в начале 2025 года. В команду основателей входят Джон Шульман, Алек Рэдфорд, Баррет Зоф и несколько других выпускников OpenAI. Thinking Machines Lab позиционирует себя как исследовательскую и продуктовую лабораторию ИИ, сосредоточенную на сотрудничестве человека и ИИ. Опыт Вэн в системах безопасности, прикладных исследованиях ИИ и робототехнике напрямую соотносится с повесткой лаборатории.

Fellows Fund — выдающийся научный сотрудник (декабрь 2024)

В декабре 2024 года венчурная фирма, специализирующаяся на ИИ, Fellows Fund, объявила Вэн своим выдающимся научным сотрудником. Она заявила: “Миссия и видение Fellows Fund очень убедительны. Для меня честь присоединиться к этой группе научных сотрудников в области ИИ, чтобы поддерживать следующее поколение основателей в сфере ИИ”.


Lil’Log (lilianweng.github.io)

Lil’Log — это личный технический блог Вэн, который ведется с 2017 года. На главной странице она просто описывает его происхождение: “Я документирую свои учебные заметки в этом блоге с 2017 года”. То, что началось как личная практика для систематизации собственного понимания, за последующие годы стало одним из самых цитируемых и используемых в качестве ссылок ресурсов в сообществе исследователей и инженеров ML — каноническим первым справочником для практикующих специалистов, сталкивающихся с новыми темами.

Авторитет блога основан на сочетании исключительной глубины, педагогической ясности и актуальности исследований. Статьи обычно рассчитаны на 20–45 минут чтения, систематически охватывают соответствующую литературу с формальными обозначениями и обновляются по мере развития области. Они функционируют не как чистые руководства или чистые обзоры литературы, а как нечто более близкое к идеальному объяснению темы аспирантом — технически строгие, самодостаточные и движимые подлинным любопытством к пониманию, а не к эффектности.

Избранные основные статьи:

Статья Дата Значение
Долгий взгляд на обучение с подкреплением Фев 2018 Всесторонний обзор RL; широко используется как учебный справочник
Мета-обучение: обучение тому, как учиться за несколько шагов Ноя 2018 Каноническое введение в мета-обучение
Рандомизация среды для переноса из симуляции в реальность Май 2019 Подробное техническое объяснение контекста исследований Вэн в робототехнике
Что такое диффузионные модели? Июл 2021 Стал стандартным введением в диффузионные модели до Stable Diffusion; неоднократно обновлялся до 2024 года
Контрастное обучение представлениям Май 2021 Всесторонний обзор самоконтролируемого обучения
Как обучать действительно большие модели на множестве GPU? Сен 2021 Соавтор улучшенной версии с Грегом Брокманом в блоге OpenAI
Оптимизация вывода больших трансформерных моделей Янв 2023 Систематизировала литературу по эффективности вывода
Инженерия промптов Мар 2023 Одно из самых читаемых введений в эту область; характеризовала ее как “эмпирическую науку”
Автономные агенты на основе LLM Июн 2023 Определила структуру агента (планирование/память/использование инструментов), которая стала доминирующей в последующих исследованиях агентов
Состязательные атаки на LLM Окт 2023 Всесторонний обзор взломов (jailbreaking) и состязательной устойчивости
Размышления о высококачественных человеческих данных Фев 2024 Анализ качества разметки, маркировки в RLHF и недооценки работы с данными
Хакерство вознаграждений в обучении с подкреплением Ноя 2024 Ее последняя крупная статья эпохи OpenAI; обобщила критические для безопасности режимы отказа
Почему мы думаем Май 2025 Анализ вычислений во время тестирования и цепочки рассуждений; поблагодарила Джона Шульмана за “чрезвычайно ценные отзывы и прямые правки”

Статья “Автономные агенты на основе LLM” (июнь 2023) — самая цитируемая работа в блоге Вэн. В ней была представлена связная структура — LLM как мозг агента, дополненный планированием, памятью и использованием инструментов — которая стала эталонной концептуальной структурой для проектирования систем агентов как в исследовательских работах, так и в разработке продуктов. Влияние этой статьи на то, как область описывает и строит LLM-агентов, трудно переоценить.


Ключевые вклады

  • Lil’Log — Семь лет глубоко проработанных, педагогически выдающихся постов в блоге об ML, которые сформировали то, как целое поколение исследователей и инженеров понимает эту область; «Что такое диффузионные модели?» и «Автономные агенты на основе LLM» — одни из самых читаемых объяснений ML из когда-либо написанных.

  • Системы безопасности OpenAI — Построила и возглавила команду, ответственную за защиту передовых моделей OpenAI от состязательных атак, хакерства вознаграждений и катастрофических рисков; созданные ею внешние программы red-teaming и оценки готовности институционализировали структурированную оценку безопасности в передовой лаборатории ИИ.

  • Ловкое манипулирование кубиком Рубика — Ключевой участник проекта робототехники OpenAI, демонстрирующего ловкое манипулирование в руке с помощью обучения с подкреплением с рандомизацией среды; знаковый результат в физическом ИИ.

  • Прикладные исследования ИИ в OpenAI — Руководила переходом исследовательских возможностей OpenAI в прикладные системы, внеся вклад в разработку инфраструктуры оценки и согласования, лежащей в основе ChatGPT и GPT-4.

  • Политика и управление безопасностью — Входила в комитет по безопасности и защите совета директоров OpenAI; ее объединение исследований в области безопасности под единой должностью вице-президента представляло собой структурное обязательство OpenAI по обеспечению интегрированного надзора за безопасностью.


Награды и признание

  • Business Insider 2024 AI Power List — Отмечена за лидерство в безопасной и этичной разработке ИИ.
  • Fellows Fund Distinguished Fellow (декабрь 2024).
  • Более 48 000 цитирований в Google Scholar — отражая охват как ее исследовательских публикаций, так и косвенное научное влияние Lil’Log.

Ключевые отношения

  • Мира Мурати — Сооснователь Thinking Machines Lab; их совместное основание отражает общее убеждение в том, что безопасность и исследовательская инфраструктура неотделимы от разработки мощного ИИ.
  • Джон Шульман — Сооснователь Thinking Machines Lab; Вэн благодарит его за прямые правки в статье «Почему мы думаем» (2025); давний интеллектуальный соавтор в области RL и рассуждений.
  • Александр Мондри — Предшественник на посту руководителя работы по обеспечению готовности к безопасности в OpenAI; Вэн взяла на себя команду по готовности, когда Мондри был переведен на другую должность в июле 2024 года, прежде чем была повышена до вице-президента.
  • Ян Лайке — Бывший руководитель по безопасности OpenAI, чей громкий уход предшествовал назначению Вэн; оба были частью волны уходов, связанных с безопасностью, которая характеризовала OpenAI в 2024 году.
  • Грег Брокман — Соавтор улучшенной версии статьи Вэн «Как обучать действительно большие модели» для блога OpenAI; один из сигналов ее интеграции в культуру исследовательских коммуникаций OpenAI.

Личный стиль

Публичное присутствие Вэн определяется парадоксом: она является одним из самых читаемых технических писателей в области ИИ, однако ее блог носит устойчивый оттенок личных заметок, а не авторитетного изложения. Эта скромность искренняя и биографическая. Она прослеживает ее до участия в детских математических олимпиадах, где она рано столкнулась с пределами собственного таланта, научившись подходить к сложным задачам постепенно, а не героически. Она описывает свои основные черты как «настойчивость» и «скромность»; друзья описывают ее как «организованную» и «терпеливую». Отказ от ответственности в начале блога — упоминание грамматических ошибок как доказательства того, что ChatGPT не участвует — сигнализирует о том, что написание текста является намеренным и от первого лица в области, где полировка с помощью ИИ стала нормой. Ее философия безопасности параллельна ее личной эпистемологии: она заявила, что «масштабирование — это не единственный рецепт» и что согласование и безопасность являются «самыми насущными проблемами прямо сейчас» — позиция, основанная не на внешней критике, а на многолетнем опыте построения этих систем изнутри. Ее профиль на Digg vibe (доминирующие темы: обучение с подкреплением, безопасность ИИ, согласование LLM) отражает коммуникатора, чья публичная идентичность оставалась технически обоснованной на протяжении всего ее институционального роста.


Ссылки