Quanquan Gu

Teórico de aprendizado de máquina e líder de pesquisa em IA que simultaneamente avançou a previsão de estruturas de proteínas na fronteira da IA para a Ciência e co-liderou o pré-treinamento e escalonamento de LLMs na ByteDance Seed.


Nascimento c. 1984, China
Nacionalidade Chinês-Americano
Instituição(ões) Atual(ais) Universidade da Califórnia, Los Angeles — Departamento de Ciência da Computação (Professor Associado com Estabilidade, em licença); ByteDance Research (Cientista de Pesquisa, julho de 2023–junho de 2026, saiu)
Áreas de Pesquisa Otimização Não-convexa, Teoria do Aprendizado Profundo, Aprendizado por Reforço, Grandes Modelos de Linguagem, IA para a Ciência (Design e Previsão de Estruturas de Proteínas), Modelos de Difusão
Orientador de Doutorado Jiawei Han
Tese de Doutorado Aprendizado Online e Ativo de Grandes Redes: Teoria e Algoritmos (Universidade de Illinois em Urbana-Champaign, 2014)
Site web.cs.ucla.edu/~qgu
X / Twitter @QuanquanGu
Google Acadêmico Quanquan Gu

Visão Geral

Quanquan Gu é um pesquisador de aprendizado de máquina chinês-americano e Professor Associado efetivo de Ciência da Computação na UCLA, conhecido por contribuições teóricas rigorosas ao aprendizado profundo, otimização não-convexa e aprendizado por reforço. De julho de 2023 a junho de 2026, ocupou um cargo simultâneo de cientista de pesquisa na ByteDance Seed, onde liderou duas frentes de pesquisa distintas: primeiro, construindo uma das pilhas de IA para ciência de proteínas mais competitivas da indústria, depois, migrando para co-fundar a equipe de otimização e escalonamento de LLMs que sustentou o desenvolvimento do Seed 2.0. Seu domínio paralelo de teoria de ML, IA biológica e pré-treinamento em larga escala — campos que raramente se sobrepõem em um único pesquisador — atraiu atenção sustentada tanto na academia quanto na indústria. Ele deixou a ByteDance em junho de 2026, despedindo-se com a frase „O melhor modelo ainda está por vir. O escalonamento continua“, sem revelar seu próximo destino.


Início da Vida e Educação

Gu concluiu seus estudos de graduação na Universidade Tsinghua, obtendo um Bacharelado em Engenharia em Automação (2003–2007), seguido por um Mestrado em Ciência da Engenharia de Controle na mesma instituição (2007–2010). Em seguida, mudou-se para os Estados Unidos para fazer doutorado na Universidade de Illinois em Urbana-Champaign (UIUC) sob a supervisão de Jiawei Han, um dos pesquisadores mais citados em mineração de dados e descoberta de conhecimento. Sua dissertação, Aprendizado Online e Ativo de Grandes Redes: Teoria e Algoritmos, abordou o desafio de aprender eficientemente a partir de redes de informação massivas e em rápida evolução, combinando algoritmos de aprendizado online com estratégias de aprendizado ativo. Ele concluiu seu PhD em 2014 e recebeu a Bolsa do Departamento de Ciência da Computação da UIUC (2010) e a Bolsa de PhD da IBM (2013–2014) durante seus estudos de doutorado. Após a formatura, passou um ano como Associado de Pesquisa de Pós-Doutorado no Departamento de Pesquisa Operacional e Engenharia Financeira da Universidade de Princeton (2014–2015).


Carreira

Universidade da Virgínia (2015–2018)

Gu ingressou na UVa como Professor Assistente em regime probatório, inicialmente no Departamento de Engenharia de Sistemas e Informação (2015–2017), com uma nomeação simultânea no Departamento de Ciência da Computação adicionada de 2016 até sua saída em 2018. Durante este período, estabeleceu sua agenda de pesquisa em otimização não-convexa e fundamentos teóricos do aprendizado profundo, publicando trabalhos iniciais sobre métodos de redução de variância estocástica e teoria da aprendizagem estatística para modelos superparametrizados. Recebeu o Prêmio NSF CAREER (2017) e o Prêmio de Inovação em Pesquisa SEAS da UVa (2017) enquanto estava na UVa, e garantiu múltiplas bolsas NSF sobre aprendizado de máquina com privacidade e dados de alta dimensionalidade.

Universidade da Califórnia, Los Angeles, Departamento de Ciência da Computação (2018–presente)

Gu ingressou na UCLA como Professor Assistente em regime probatório em julho de 2018, foi promovido a Professor Associado com Estabilidade em julho de 2022, e lidera o Laboratório de Inteligência Artificial Geral da UCLA. Seu grupo de pesquisa produziu um corpo substancial de trabalho em quatro áreas interconectadas.

Em teoria de otimização e aprendizado profundo, o laboratório derivou limites de generalização rigorosos para a descida do gradiente estocástica em redes superparametrizadas, caracterizou o overfitting benigno em redes neurais convolucionais de duas camadas (NeurIPS 2022, Oral), e analisou a regularização implícita do SGD em uma série de artigos. O otimizador MARS (ICML 2025) introduziu um novo arcabouço de redução de variância para treinar grandes modelos, e a Atenção por Produto Tensorial (NeurIPS 2025, Spotlight) propôs uma nova arquitetura de mecanismo de atenção.

Em aprendizado por reforço, o grupo estabeleceu resultados de complexidade amostral quase minimax ótimos para processos de decisão de Markov lineares e MDPs de mistura linear (COLT 2021, ICML 2021, ICML 2023), contribuindo para uma teoria rigorosa de RL provadamente eficiente com aproximação de funções.

Em alinhamento e ajuste fino de modelos de linguagem, Gu co-desenvolveu o Self-Play Fine-Tuning (SPIN, ICML 2024), um método que permite a um modelo de linguagem melhorar iterativamente jogando contra suas próprias saídas de iterações anteriores sem exigir anotações humanas adicionais, e estendeu o arcabouço para modelos de difusão para geração de texto para imagem (NeurIPS 2024). O Self-Play Preference Optimization (SPPO, ICLR 2025) refinou isso em uma abordagem de alinhamento baseada em princípios.

Em IA para a ciência, o trabalho baseado na UCLA sobre design de medicamentos baseado em estruturas (DecompDiff, ICLR 2024; DecompOpt, ICLR 2024) e modelagem de conformação de proteínas (ICML 2024) prefigurou e informou diretamente a pesquisa biológica em escala industrial que Gu lideraria mais tarde na ByteDance.

Durante a pandemia de COVID-19 (2020–2021), sua equipe desenvolveu o modelo epidemiológico UCLA SuEIR, que foi usado pelos Centros de Controle e Prevenção de Doenças dos EUA para previsões semanais de mortes e hospitalizações acumuladas, com resultados publicados no PNAS (2022, 2023).

Gu também realizou duas residências de pesquisa estendidas no Instituto Simons para a Teoria da Computação: como Bolsista de Pesquisa no Programa de Verão de Fundamentos do Aprendizado Profundo em Berkeley (maio–agosto de 2019), e como Participante de Longo Prazo no Programa de Teoria do Aprendizado por Reforço (agosto–dezembro de 2020). Ele foi adicionalmente um Visitante de Curto Prazo no Instituto de Estudos Avançados em Princeton durante o Ano Especial em Otimização, Estatística e Aprendizado de Máquina Teórico (outubro–novembro de 2019).

ByteDance Research (julho de 2023–junho de 2026)

Gu ingressou na ByteDance Research em julho de 2023 para liderar a iniciativa de IA para Descoberta de Medicamentos da empresa, mantendo simultaneamente seu cargo de professor na UCLA em licença. Em aproximadamente dezoito meses, sua equipe produziu três resultados principais em biologia computacional.

SeedFold (arXiv: 2512.24354, dezembro de 2025) é um sistema de previsão de estrutura biomolecular que escala a arquitetura do AlphaFold 3 ao longo de três eixos — largura do modelo, eficiência arquitetônica via atenção triangular linear e volume de dados por meio de destilação em larga escala para 26,5 milhões de amostras de treinamento. Avaliado no FoldBench, o SeedFold superou o AlphaFold 3 na maioria das tarefas relacionadas a proteínas, incluindo previsão de monômeros, docking proteína-proteína, complexos anticorpo-antígeno e ligação proteína-ligante.

SeedProteo (arXiv: 2512.24192, fevereiro de 2026) é um sistema de design de novo de ligantes de proteínas todos-átomos baseado em difusão que reaproveita a arquitetura de dobramento do SeedFold como um arcabouço generativo, integrando características de auto-condicionamento para guiar o processo de design. Na geração incondicional, lida com sequências de até 1.000 resíduos, e em benchmarks de design de ligantes superou AlphaProteo, RFDiffusion, Chai-2, BinderCraft e BoltzGen. A validação in vitro em alvos PD-L1 e SC2RBD confirmou ligantes expressos experimentalmente e que se ligam.

DPLM / DPLM-2 é uma família de modelos de linguagem de proteínas de difusão (ICML 2024; ICLR 2025; estendido no ICML 2025) que unificam a aprendizagem de representação de proteínas, geração incondicional e geração condicional qualquer-para-qualquer — incluindo dobramento, dobramento inverso e scaffolding de motivos — sob um único objetivo de pré-treinamento de difusão discreta. O DPLM-2 estende o arcabouço para modelar conjuntamente sequência e estrutura 3D dentro de uma única espinha dorsal pré-treinada.

No início de 2025, após os lançamentos de alto perfil da DeepSeek que catalisaram a competição intensificada de LLMs na China, Gu migrou para se juntar ao esforço de modelo de fronteira da ByteDance, fundando a equipe de otimização e escalonamento de LLMs dentro do grupo de pré-treinamento Seed. Esta equipe construiu uma pilha de pré-treinamento escalável do zero e contribuiu diretamente para o desenvolvimento e lançamento do Seed 2.0 — o principal modelo de fronteira da ByteDance — cerca de quatro meses antes da saída de Gu. O assistente de IA Doubao da ByteDance, que integra as capacidades do Seed 2.0, alcançou aproximadamente 336 milhões de usuários ativos mensais em meados de 2026.

Gu anunciou sua saída da ByteDance Seed em 3 de junho de 2026, agradecendo aos colegas por „uma jornada incrivelmente gratificante“ sem revelar seu próximo passo.


Principais Contribuições

  • SeedFold — O primeiro sistema de previsão de estrutura biomolecular implantado industrialmente a superar o AlphaFold 3 em uma ampla gama de tarefas do FoldBench, combinando escalonamento de arquitetura, atenção linear e destilação de dados em larga escala para 26,5 milhões de amostras.
  • SeedProteo — Modelo de design de ligantes de proteínas todos-átomos de novo de última geração, superando todos os principais concorrentes de código aberto em benchmarks in-silico com validação experimental in vitro; implantado publicamente em seedfold.io.
  • Série DPLM — Uma família de modelos de linguagem de proteínas de difusão (ICML 2024, ICLR 2025) unificando aprendizagem de representação e geração condicional/incondicional; DPLM-2 modela conjuntamente sequência e estrutura 3D dentro de uma única espinha dorsal pré-treinada.
  • Pilha de pré-treinamento do Seed 2.0 — Co-liderou a equipe de otimização e escalonamento de LLMs que construiu a infraestrutura de pré-treinamento de fronteira escalável da ByteDance, alimentando diretamente o Seed 2.0 e modelos subsequentes.
  • Self-Play Fine-Tuning (SPIN) — Um arcabouço de autoaperfeiçoamento de modelo de linguagem (ICML 2024) permitindo melhoria iterativa sem anotação humana adicional; estendido para modelos de difusão (NeurIPS 2024) e otimização de preferência (SPPO, ICLR 2025).
  • Teoria do overfitting benigno — Uma série de artigos caracterizando quando redes neurais superparametrizadas treinadas por SGD generalizam apesar de interpolar dados de treinamento (NeurIPS 2022 Oral; COLT 2021; JMLR 2024), fornecendo uma base rigorosa para um fenômeno empírico difundido no aprendizado profundo moderno.
  • Aprendizado por reforço provadamente eficiente — Estabeleceu limites de complexidade amostral quase minimax ótimos para MDPs lineares e MDPs de mistura linear (COLT 2021, ICML 2021, ICML 2023), colocando algoritmos de RL em bases teóricas rigorosas.
  • Modelo UCLA SuEIR — Modelo epidemiológico de COVID-19 usado pelo CDC para previsões nacionais de mortes e hospitalizações (2020–2021), com resultados contribuindo para duas publicações no PNAS (2022, 2023).
  • EurekaClaw — Um agente de pesquisa de IA local-primeiro (eurekaclaw.ai) que automatiza o pipeline desde a ideação até a prova, experimento e geração de artigos, incorporando a visão mais ampla de Gu de descoberta científica aumentada por IA.

Prêmios e Reconhecimento

  • Prêmio WSDM Test of Time Paper (2024) — Reconhecendo o impacto de longo prazo da pesquisa inicial sobre redes de informação e aprendizado.
  • Bolsa de Pesquisa Alfred P. Sloan (2022) — Concedida pela Fundação Alfred P. Sloan por contribuições excepcionais no início da carreira para aprendizado de máquina e IA.
  • Prêmio de Pesquisa da Faculdade JP Morgan (2022) — Reconhecimento corporativo do impacto da pesquisa aplicada em ML.
  • Prêmio de Pesquisa em Aprendizado de Máquina da AWS (2020) — Reconhecimento da Amazon Web Services por contribuições à pesquisa em aprendizado de máquina.
  • Palestra de Início de Carreira no IJCAI (2020) — Selecionado para ministrar uma palestra convidada de início de carreira na Conferência Internacional Conjunta sobre Inteligência Artificial.
  • Bolsa de Pesquisa Simons Berkeley (2019) — Bolsa no Instituto Simons para a Teoria da Computação, Programa de Verão de Fundamentos do Aprendizado Profundo.
  • Prêmio de Pesquisa em Ciência de Dados da Adobe (2018) e Prêmio de Pesquisa em Aprendizado Profundo da Salesforce (2018) — Reconhecimento duplo da indústria no mesmo ano.
  • Prêmio NSF CAREER (2017) — O principal prêmio de início de carreira da Fundação Nacional de Ciência dos EUA, apoiando seu programa de pesquisa sobre otimização estatística não-convexa.
  • Prêmio de Inovação em Pesquisa SEAS da UVa (2017) — Reconhecimento da Escola de Engenharia da Universidade da Virgínia por inovação em pesquisa.
  • Prêmio de Melhoria de Carreira Acadêmica Yahoo! (2015) — Concedido no início de sua carreira docente.
  • Bolsa de PhD da IBM (2013–2014) — Bolsa competitiva da IBM apoiando pesquisa de doutorado.
  • Prêmio de Melhor Dissertação de Mestrado, Universidade Tsinghua (2010) — Reconhecimento departamental por trabalho excepcional de dissertação de mestrado.
  • Bolsa do Departamento de Ciência da Computação da UIUC (2010) — Bolsa apoiando a entrada no programa de doutorado na UIUC.

Relacionamentos Chave

  • Jiawei Han — Orientador de PhD na UIUC; uma das figuras mais influentes em mineração de dados, cujo trabalho sobre descoberta de conhecimento a partir de redes moldou diretamente a dissertação e a agenda de pesquisa inicial de Gu.
  • Zaixiang Zheng — Colaborador principal na ByteDance Seed; líder de projeto no DPLM, DPLM-2, SeedProteo e sistemas de modelagem de proteínas relacionados.
  • Xinyou Wang — Coautor chave nos artigos DPLM e DPLM-2 (ICML 2024, ICLR 2025), central para a construção da série de modelos de linguagem de proteínas.
  • Huizhuo Yuan — Coautor frequente tanto no trabalho da UCLA (otimizador MARS, SPPO) quanto da ByteDance; uma figura chave no fio de pesquisa de LLM e otimização de Gu.
  • Dongruo Zhou — Coautor prolífico em teoria de aprendizado por reforço (vários artigos ICML e NeurIPS) e otimização não-convexa; agora um pesquisador independente.
  • Difan Zou — Coautor em uma série de artigos influentes analisando a regularização implícita do SGD e overfitting benigno em modelos superparametrizados.
  • Zixiang Chen — Coautor em teoria de aprendizado profundo e a linha de trabalho Self-Play Fine-Tuning (SPIN, ICML 2024).

Estilo Pessoal

Gu é incomum entre os pesquisadores de ML por sustentar um trabalho teórico rigoroso e de alta produção na academia enquanto simultaneamente impulsiona a engenharia aplicada na fronteira da IA da indústria — um modo de operação que tipicamente exige trade-offs que ele pareceu resistir. Seu estilo de pesquisa em ambos os ambientes é caracterizado por uma preferência por garantias estatísticas minimax-ótimas em vez de melhorias de desempenho heurísticas, mesmo em cenários motivados pela prática. Publicamente, ele tem sido um defensor vocal da visão de que a IA não é meramente uma ferramenta para pesquisa, mas está ativamente reestruturando o próprio pipeline de pesquisa — seu projeto EurekaClaw e comentários no X refletem uma convicção de que a „descoberta em nível de sistema“, onde humanos, modelos e ferramentas coevoluem, já está em andamento. Sua saída da ByteDance com a despedida concisa „O melhor modelo ainda está por vir. O escalonamento continua“ foi amplamente lida como uma declaração de intenção, e não de retrospectiva.


Referências