Тим Роктэшел

Директор и руководитель группы Open-Endedness в Google DeepMind, профессор искусственного интеллекта в UCL. Его исследования объединяют нейросимволическое рассуждение, обучение с подкреплением и открытую эволюцию общего искусственного интеллекта.


Краткая информация

Гражданство Немец
Текущие места работы Google DeepMind (директор, главный научный сотрудник, руководитель группы Open-Endedness); Университетский колледж Лондона, факультет компьютерных наук (профессор ИИ, руководитель лаборатории DARK)
Области исследований Общий искусственный интеллект, открытая эволюция (open-endedness), самообучение, обучение с подкреплением, нейросимволическая интеграция, обработка естественного языка
Научный руководитель Sebastian Riedel
Докторская диссертация (название не подтверждено) (Университетский колледж Лондона, ок. 2017)
Веб-сайт rockt.ai
X / Twitter @_rockt
GitHub rockt
Google Scholar Tim Rocktäschel

Общие сведения

Tim Rocktäschel — немецкий исследователь ИИ, построивший необычно широкую карьеру, охватывающую нейросимволическое рассуждение, глубокое обучение с подкреплением и крупномасштабные генеративные среды. Он одновременно является директором и руководителем группы Open-Endedness в Google DeepMind и профессором искусственного интеллекта в Университетском колледже Лондона, где руководит лабораторией DARK (Deciding, Acting, and Reasoning with Knowledge). Его докторская работа в UCL привела к влиятельным результатам в области текстового следования и дифференцируемого доказательства теорем; последующий переход к обучению с подкреплением и открытой эволюции привел к двум наградам за лучшие статьи на ICML 2024 и приглашенному ключевому докладу на ICLR 2025, что сделало его одной из самых узнаваемых фигур на стыке обучения и рассуждений в современном ИИ.


Ранние годы и образование

Rocktäschel изучал компьютерные науки в Берлинском университете имени Гумбольдта, получив диплом (эквивалент магистра) в 2012 году. Во время учебы и в начале аспирантуры, с 2010 по 2012 год, он работал ассистентом-студентом, а в 2013 году — научным ассистентом в группе управления знаниями в биоинформатике того же университета. В 2013 году он начал докторантуру в группе машинного чтения UCL под руководством Sebastian Riedel, изначально финансируемую стипендией Microsoft Research PhD Scholarship. Во время обучения он проходил стажировку в Google DeepMind летом 2015 года, а в 2017 году получил стипендию Google PhD Fellowship в области обработки естественного языка — одну из самых престижных докторских наград в этой области.


Карьера

Университетский колледж Лондона — докторантура (2013–ок. 2017)

Работая в группе машинного чтения UCL, докторские исследования Rocktäschel были сосредоточены на моделях машинного обучения, включающих структурированные априорные знания. Его самой цитируемой работой докторского периода является статья 2015 года «Reasoning about Entailment with Neural Attention» (ICLR 2016), написанная в соавторстве с Edward Grefenstette, Karl Moritz Hermann, Tomáš Kočiský и Phil Blunsom. В ней было представлено пословное внимание к кодировщикам LSTM, что стало знаковым событием в исследованиях нейронного NLI. Его смежная с диссертацией работа «End-to-End Differentiable Proving» (NeurIPS 2017), написанная в соавторстве с Riedel, представила нейронные доказатели теорем, которые переформулируют обратную цепочку Prolog как дифференцируемое вычисление над вложениями символов, сочетая символическую логику с обучением на основе градиента.

Оксфордский университет — постдокторант (май 2017 – август 2018)

После завершения докторантуры Rocktäschel присоединился к Исследовательской лаборатории Whiteson на факультете компьютерных наук Оксфорда в качестве постдокторанта по обучению с подкреплением. Одновременно он занимал должности младшего научного сотрудника в области компьютерных наук в колледже Иисуса и стипендиата-лектора в Хертфорд-колледже. Этот период ознаменовал его поворот к обучению с подкреплением и средам на основе агентов — направлению, которое определило следующий этап его карьеры.

Meta AI — FAIR (август 2018 – ок. 2022)

Rocktäschel присоединился к Facebook AI Research (FAIR) в Лондоне в качестве научного сотрудника, впоследствии став менеджером и руководителем направления. Одновременно с приходом в FAIR, с августа 2018 года он был назначен лектором (позже профессором) в UCL и основал лабораторию DARK. В FAIR его группа активно работала над агентами наземного RL и средами открытого обучения, включая значительное участие в NetHack Learning Environment — процедурно генерируемой игре-roguelike, ставшей стандартным бенчмарком для оценки эффективности выборки и обобщения в исследованиях RL. Его группа продвигала NetHack как сложную область именно потому, что, несмотря на кажущуюся простоту, она оставалась трудной для современного ИИ, требуя долгосрочного рассуждения и адаптации.

Google DeepMind (ок. 2022 – настоящее время)

Rocktäschel перешел в Google DeepMind, где занимает должности директора, главного научного сотрудника и руководителя группы Open-Endedness. В этой роли он руководит исследованиями, направленными на разработку систем ИИ, способных к открытому самообучению и генерации учебных программ. Его группа опубликовала две статьи, получившие награды за лучшие работы на ICML 2024: «Genie: Generative Interactive Environments», где была продемонстрирована модель мира, способная генерировать интерактивные 2D-среды по одному изображению-подсказке, и «Debating with More Persuasive LLMs Leads to More Truthful Answers», где было показано, что масштабируемый контроль с помощью дебатов LLM может повысить фактическую точность. Он выступил с приглашенным ключевым докладом на ICLR 2025, посвященном открытой эволюции и общему интеллекту. Он также является членом ELLIS (Европейской лаборатории обучения и интеллектуальных систем).


Ключевые вклады

  • «Reasoning about Entailment with Neural Attention» (ICLR 2016, с Grefenstette, Hermann, Kočiský, Blunsom) — первая универсальная сквозная дифференцируемая система, достигшая передового уровня на наборе данных текстового следования. Популяризировала пословное внимание и помогла задать направление для исследований NLI, предшествовавших эпохе Transformer.
  • End-to-End Differentiable Proving / Neural Theorem Provers (NeurIPS 2017, с Riedel) — представила NTP, которые переформулируют обратную цепочку Prolog как дифференцируемое вычисление над векторными представлениями символов, что стало фундаментальным вкладом в нейросимволический ИИ.
  • e-SNLI: Natural Language Inference with Natural Language Explanations (NeurIPS 2018, с Camburu, Lukasiewicz, Blunsom) — расширила бенчмарк SNLI человеческими объяснениями на естественном языке, открыв новые возможности для исследований объяснимых моделей NLI.
  • NetHack Learning Environment — совместно разработанный строгий бенчмарк RL, предоставляющий процедурно генерируемую среду, которая остается в значительной степени нерешенной и продолжает стимулировать исследования в области эффективности выборки и обобщения.
  • «Genie: Generative Interactive Environments» (лучшая статья ICML 2024, с Bruce, Dennis, Parker-Holder и др. из DeepMind) — продемонстрировала модель мира, генерирующую играбельные 2D-интерактивные среды из немаркированного видео, продвигая программу открытой эволюции.
  • «Debating with More Persuasive LLMs Leads to More Truthful Answers» (лучшая статья ICML 2024, с Khan, Hughes, Grefenstette, Bowman, Perez и др.) — предоставила эмпирическую поддержку масштабируемого контроля посредством дебатов как механизма повышения правдивости LLM.
  • Лаборатория DARK в UCL — основал и руководит исследовательской группой в UCL, сосредоточенной на агентах, которые принимают решения, действуют и рассуждают со знаниями, выпуская поток докторантов и постдоков в области RL и NLP, которые заняли позиции в DeepMind, FAIR и академических учреждениях.

Награды и признание

  • Microsoft Research PhD Scholarship (2013) — конкурсное финансирование докторских исследований в UCL.
  • Google PhD Fellowship in Natural Language Processing (2017) — одна из немногих стипендий, присуждаемых ежегодно по всем областям компьютерных наук.
  • Две премии за лучшие статьи на ICML (2024) — за «Genie» и «Debating with More Persuasive LLMs»; один из немногих исследователей, получивших множественные награды за лучшие статьи на одной ведущей конференции за один год.
  • Приглашенный ключевой доклад на ICLR (2025) — признан ведущим голосом в области открытой эволюции и общего интеллекта.
  • Член ELLIS — член общеевропейской сети ведущих исследователей ИИ.

Ключевые связи

  • Sebastian Riedel — научный руководитель докторантуры в UCL; соавтор по нейронным доказателям теорем; сейчас в Google DeepMind. Самые формирующие интеллектуальные отношения в карьере Rocktäschel.
  • Shimon Whiteson — руководитель постдокторантуры в Оксфорде; исследовательская лаборатория Whiteson познакомила Rocktäschel с глубоким RL, определив его последующую траекторию.
  • Edward Grefenstette — постоянный соавтор со времен статьи о внимании к следствию (2015); также соавтор статьи ICML 2024 о дебатах.
  • Phil Blunsom — соавтор статей о следствии и e-SNLI; давний участник экосистемы NLP в Оксфорде/DeepMind.
  • Jack Parker-Holder — близкий соавтор в DeepMind по открытой эволюции и Genie; центральный член группы Open-Endedness.
  • Ethan Perez — соавтор статьи о дебатах; сейчас работает в Anthropic над масштабируемым контролем, что отражает общие интересы в области выравнивания через дебаты.
  • Jeff Clune — ведущий сторонник открытой эволюции; интеллектуальный союзник, чьи предыдущие работы по качественному разнообразию и алгоритмам, генерирующим ИИ, влияют на программу DeepMind по открытой эволюции.

Личный стиль

Исследования Rocktäschel отличаются отчетливой долгосрочной связностью: его докторская работа по дифференцированию символической логики, работы эпохи RL по агентам, которые должны накапливать и передавать знания, и его нынешняя программа открытого самообучения — все это вариации одного и того же вопроса: как построить системы, которые накапливают и повторно используют структурированные знания без точных указаний, как это делать. Он известен тем, что отстаивает сложные, «нерешенные» бенчмарки, такие как NetHack, в качестве противоядия от насыщения бенчмарков, а его публичные тексты и выступления часто подчеркивают то, чего современные модели все еще не могут сделать, а не восхваляют то, что они могут. Его одновременные академические и промышленные роли отражают осознанную стратегию: сохранять университетскую лабораторию для долгосрочных исследований, одновременно будучи встроенным в промышленную исследовательскую организацию, обладающую вычислительными ресурсами для их проверки.


Ссылки