Sara Hooker

Pesquisadora de IA, VP de Pesquisa na Cohere, cofundadora e CEO da Adaption — conhecida pela tese da Loteria do Hardware, trabalho pioneiro em compressão de modelos e viés, construção de IA multilíngue através da iniciativa Aya, e um argumento contrário sustentado de que a escala sozinha não pode sustentar a próxima década de progresso da IA.


Perfil

Campo Detalhe
Nascimento Dublin, Irlanda
Nacionalidade Irlandesa / cresceu em vários países da África Subsaariana
Instituição Atual Adaption (Cofundadora e CEO)
Áreas de Pesquisa Eficiência de Modelos, Aprendizado Contínuo, IA Multilíngue, Compressão de Modelos, Interpretabilidade, Justiça Algorítmica, Metodologia de Benchmark
Orientadores de Doutorado Hugo Larochelle; Aaron Courville
Formação Acadêmica Carleton College (B.A.); Mila – Quebec AI Institute (Ph.D.)
Site Pessoal sarahooker.me
X / Twitter @sarahookr
GitHub @sarahooker
Google Scholar scholar.google.com

Visão Geral

Sara Hooker é uma cientista da computação nascida na Irlanda que fez contribuições distintas em compressão de modelos, interpretabilidade, IA multilíngue e sociologia dos incentivos à pesquisa em IA. Ela é mais conhecida por „The Hardware Lottery" (2020), um ensaio conceitual publicado na Communications of the ACM argumentando que o sucesso das ideias de IA é moldado menos por seu mérito intrínseco do que por quão bem elas conseguem explorar o hardware disponível na época — uma tese que reformulou debates sobre viés de pesquisa na área. Como VP de Pesquisa e chefe do Cohere Labs de 2022 a 2025, ela liderou a iniciativa Aya, um projeto de modelo multilíngue crowdsourced que mobilizou mais de 3.000 pesquisadores em 119 países e mais que dobrou o número de idiomas cobertos por IA generativa aberta. Em outubro de 2025, cofundou a Adaption com Sudip Roy, levantando uma rodada inicial de US$ 50 milhões em fevereiro de 2026 para construir sistemas de IA que aprendem continuamente e se adaptam no momento da inferência — uma aposta explícita contra a ortodoxia da lei de escala. Sua formação abrange cinco países africanos, Irlanda e múltiplas instituições de pesquisa acadêmicas e corporativas; seu trabalho retorna consistentemente à questão de quem a pesquisa de IA serve e o que ela sistematicamente ignora.


Primeiros Anos e Educação

Os pais de Hooker — uma mãe irlandesa e um pai britânico que se conheceram no Sudão — mudaram-se para o Lesoto quando ela tinha quatro anos de idade. Ela cresceu em vários países da África Subsaariana, morando na África do Sul, Moçambique (onde frequentou o ensino médio com instrução em português), Lesoto, Suazilândia, Quênia e Libéria até os dezenove anos. A experiência de navegar por múltiplos idiomas e sistemas educacionais quando criança — e testemunhar a distribuição desigual do acesso à infraestrutura — mais tarde animaria seu foco de pesquisa em IA eficiente e multilíngue.

B.A., Carleton College (Turma de 2013)
Hooker estudou no Carleton College em Northfield, Minnesota, onde desenvolveu seu interesse inicial por ciência da computação e métodos quantitativos.

Ph.D., Ciência da Computação — Mila – Quebec AI Institute
Hooker completou seu doutorado no Mila, supervisionada conjuntamente por Hugo Larochelle e Aaron Courville, duas das figuras centrais da escola de aprendizado profundo de Montreal. Seu trabalho de doutorado focou em fluxos de gradiente, dinâmicas de treinamento de redes neurais e as propriedades de redes esparsas e comprimidas — direções de pesquisa que alimentariam diretamente seu trabalho aplicado posterior no Google Brain.


Carreira

Delta Analytics — Fundadora (2014–presente)

Em 2014, enquanto concluía seu doutorado, Hooker fundou a Delta Analytics, uma organização sem fins lucrativos que desenvolve capacitação técnica para organizações sem fins lucrativos e do setor social por meio de projetos de ciência de dados. A organização continuou operando independentemente de seus papéis subsequentes.

Google Brain / Google DeepMind — Cientista de Pesquisa (2017–2022)

Hooker ingressou no Google Brain em 2017, onde trabalhou com interpretabilidade de modelos, compressão e esparsidade. Vários de seus artigos-chave se originam desse período:

Seu benchmark de interpretabilidade (NeurIPS 2019) propôs um protocolo de avaliação rigoroso — ROAR (Remover e Retreinar) — para testar se os métodos de saliência realmente identificam as características nas quais um modelo se baseia, destacando uma falta de confiabilidade significativa em métodos padrão. Seu trabalho de compressão e poda examinou o que as redes neurais esquecem quando comprimidas, mostrando empiricamente que a poda degrada desproporcionalmente o desempenho em dados sub-representados e de cauda longa — uma ligação inicial e importante entre compressão de modelos e justiça algorítmica. „The Hardware Lottery" (2020) consolidou a pesquisa desse período em um ensaio conceitual influente sobre como as restrições de hardware favorecem sistematicamente certas famílias algorítmicas em detrimento de outras, moldando a trajetória do campo de maneiras que os pesquisadores raramente tornam explícitas.

Em 2019, Hooker foi membro fundador do primeiro escritório de pesquisa de IA do Google no continente africano, localizado em Accra, Gana — um papel consistente com seu interesse de longa data em expandir onde a pesquisa de IA acontece geograficamente.

Cohere Labs / Cohere For AI — VP de Pesquisa (Abril de 2022–2025)

Hooker ingressou na Cohere em abril de 2022 para construir e liderar o Cohere Labs (também conhecido como Cohere For AI), o braço de pesquisa da empresa, posicionado como um laboratório de pesquisa adjacente a uma organização sem fins lucrativos que busca ciência aberta junto com as atividades comerciais da Cohere. Sob sua liderança, o laboratório lançou várias iniciativas notáveis:

Projeto Aya (2023–2024): Um esforço colaborativo de grande escala coordenando mais de 3.000 pesquisadores de 119 países para construir conjuntos de dados e modelos multilíngues de instrução. O modelo Aya resultante cobriu 101 idiomas — aproximadamente dobrando o número de idiomas suportados pelos sistemas de IA generativa aberta existentes — e foi lançado abertamente. O projeto também gerou pesquisas sobre avaliação multilíngue e os modos específicos de falha de compressão de modelos treinados em idiomas não-ingleses. Hooker descreveu a missão em termos pessoais: tendo crescido em ambientes onde português, sesoto, suázi e suaíli a rodeavam, ela conectou o acesso linguístico da IA diretamente à conexão cultural.

Aya Expanse (2024): Modelos multilíngues de alto desempenho de 8B e 32B projetados para reduzir a lacuna de capacidade entre sistemas centrados no inglês e modelos que atendem aos idiomas menos representados do mundo. Lançados abertamente junto com o trabalho original da Aya.

Programa de Acadêmicos do Cohere For AI: Hooker lançou um programa de acadêmicos estruturado para estender a mentoria e colaboração em pesquisa a pesquisadores fora das principais instituições de IA.

„The Leaderboard Illusion" (2025): Coautorado ainda no Cohere Labs, este preprint argumentou que os líderes de avaliação de modelos populares — particularmente Chatbot Arena e plataformas anônimas de preferência coletiva similares — são sistematicamente manipuláveis e produzem classificações que refletem características estilísticas superficiais e artefatos de avaliação em vez da capacidade subjacente do modelo. O artigo gerou discussão significativa sobre a validade dos benchmarks e atraiu cobertura por sua crítica de como os principais laboratórios de IA estavam gerenciando suas avaliações públicas.

Adaption — Cofundadora e CEO (Outubro de 2025–presente)

Em outubro de 2025, Hooker anunciou publicamente a Adaption (também conhecida como Adaption Labs) junto com o cofundador Sudip Roy, ex-diretor de computação de inferência na Cohere. A tese central da empresa — de que o progresso da IA será limitado menos pelo tamanho do modelo do que pela incapacidade de sistemas estáticos e congelados de se adaptarem às condições de implantação — representa uma extensão direta da crítica de uma década de Hooker ao maximalismo computacional. A Adaption está desenvolvendo sistemas focados em três pilares: dados adaptativos (aprendendo com a interação em vez de conjuntos de pré-treinamento curados), inteligência adaptativa (aprendizado no momento da inferência livre de gradiente) e interfaces adaptativas (experiências do usuário além da barra de chat padrão). Em fevereiro de 2026, a empresa levantou uma rodada inicial de US$ 50 milhões liderada pela Emergence Capital Partners, com co-investidores incluindo Mozilla Ventures, Fifty Years, Threshold Ventures, Alpha Intelligence Capital, E14 Fund e Neo. Em maio de 2026, a empresa lançou o AutoScientist, seu primeiro produto público: um sistema automatizado de ajuste fino que aumentou as taxas de vitória de 48% para 64% contra as configurações de seus próprios pesquisadores em avaliações internas.


Principais Contribuições

  • „The Hardware Lottery" (Communications of the ACM, 2021; arXiv 2020) — O artigo mais citado de autoria exclusiva de Hooker argumenta que as abordagens dominantes na pesquisa de IA são aquelas que por acaso se alinharam com as arquiteturas que o hardware GPU e TPU foi projetado para executar eficientemente. Ideias que exigem computação irregular — como raciocínio simbólico, redes de cápsulas ou modelos de ativação esparsa no momento de sua introdução — são sistematicamente desfavorecidas, independentemente de seu potencial. O artigo reformulou um viés estrutural no campo e se tornou uma referência padrão em discussões sobre sociologia da pesquisa de IA e dependência de infraestrutura.

  • Benchmark de Interpretabilidade ROAR — Introduzido em „A Benchmark for Interpretability Methods in Deep Neural Networks" (NeurIPS 2019, com Erhan, Kindermans, Been Kim), o ROAR fornece um protocolo agnóstico de modelo para avaliar métodos de saliência medindo a degradação no desempenho do modelo quando as características identificadas como importantes são removidas e o modelo é retreinado. Ele revelou que muitos métodos populares de interpretabilidade têm desempenho pouco melhor do que linhas de base aleatórias sob este teste.

  • Compressão e Justiça Algorítmica — A pesquisa de Hooker sobre o que modelos comprimidos e podados esquecem (arXiv 2019 e trabalhos subsequentes) foi uma das primeiras demonstrações sistemáticas de que a compressão de modelos prejudica desproporcionalmente o desempenho em grupos sub-representados e exemplos raros — uma descoberta com implicações práticas diretas sobre como a IA eficiente é avaliada e implantada.

  • Modelo e Conjunto de Dados Aya — Liderou a iniciativa Aya no Cohere Labs, produzindo um conjunto de dados de instrução multilíngue e modelo lançados abertamente cobrindo 101 idiomas. O projeto é uma das maiores colaborações coordenadas de pesquisa em IA multilíngue já registradas, e seus lançamentos abertos têm sido amplamente utilizados por pesquisadores que trabalham com modelos de linguagem de baixos recursos.

  • Aya Expanse — Modelos multilíngues abertos de 8B e 32B (2024) projetados para fechar a lacuna de desempenho entre sistemas dominados pelo inglês e comunidades linguísticas sub-atendidas; lançados abertamente para avançar o acesso à IA multilíngue.

  • „The Leaderboard Illusion" (arXiv 2025) — Crítica coautorada dos principais líderes de avaliação de LLMs, documentando como sistemas anônimos de preferência coletiva podem ser manipulados e como as metodologias atuais de classificação falham em distinguir capacidade genuína de efeitos de apresentação; contribuiu para uma discussão mais ampla no campo sobre a integridade da metodologia de avaliação.

  • „On the Limitations of Compute Thresholds as a Governance Strategy" (arXiv 2024) — Análise das limitações do uso de contagens de operações de ponto flutuante como um proxy para o risco de IA em frameworks de governança, argumentando que os limites de computação são um instrumento regulatório mal calibrado.

  • Delta Analytics — Fundada em 2014, esta organização sem fins lucrativos tem fornecido capacitação em ciência de dados para organizações do setor social por mais de uma década, uma expressão institucional sustentada da visão de Hooker de que a perícia técnica deve ser distribuída além de contextos movidos pelo lucro.

  • Underrated ML (podcast) — Um podcast co-apresentado com seu irmão Sean Hooker discutindo ideias e pesquisas subestimadas em aprendizado de máquina; uma expressão de seu compromisso com a comunicação científica acessível.


Prêmios e Reconhecimento

  • TIME100 AI — Pessoas Mais Influentes em IA (2024)
  • Fortune — Top 13 Inovadores em IA (2023)
  • Fórum Econômico Mundial — Conselho sobre o Futuro da Inteligência Artificial (membro contínuo)
  • Kaggle ML Advisory Research Board (membro contínuo)
  • MLC Research Group (membro)

Relacionamentos-Chave

  • Hugo Larochelle — Orientador de doutorado no Mila; agora Diretor Científico do Mila e uma das conexões profissionais mais proeminentes de Hooker; a tradição de aprendizado profundo de Montreal que Larochelle representa moldou diretamente sua abordagem às dinâmicas de treinamento e compressão.
  • Aaron Courville — Coorientador de doutorado no Mila; o trabalho de Courville em modelos generativos e teoria de redes neurais forneceu um segundo fio intelectual formativo junto com o foco de Larochelle em aprendizado profundo prático.
  • Sudip Roy — Cofundador da Adaption; ex-diretor de computação de inferência na Cohere; o contraparte operacional e técnica para a liderança de pesquisa de Hooker na construção da empresa.
  • Been Kim — Colaboradora do Google Brain; coautora do benchmark de interpretabilidade ROAR; seu trabalho conjunto em avaliação de métodos de saliência está entre os mais citados em pesquisa de interpretabilidade.
  • Shakir Mohamed — Pesquisador do Google DeepMind e cofundador do DeepIndaba; compartilha o foco de Hooker no desenvolvimento de IA africana e construção de comunidade; aparece entre suas conexões profissionais mais proeminentes.
  • Ian Goodfellow — Entre os seguidores mais proeminentes de Hooker; conexão do período do Google Brain refletindo a rede mais ampla de pesquisa do Google na qual ela estava inserida.
  • Andrew Ng — Conexão proeminente em sua rede profissional; foco compartilhado em acesso e educação em IA.

Estilo Pessoal

A escrita de Hooker é distinta por sua disposição em criticar as condições estruturais no próprio campo da IA — restrições de hardware, metodologias de benchmark, concentração geográfica de talento em pesquisa — ao invés de focar apenas na resolução técnica de problemas dentro dessas condições. Seus ensaios tendem a operar na interseção da observação empírica e da análise institucional, perguntando não apenas o que um modelo pode fazer, mas quais condições moldaram as escolhas de pesquisa que levaram a este modelo. Ela é particularmente direta sobre os custos do paradigma de escala, tendo comprometido sua empresa atual com a tese de que a próxima década de progresso da IA requer eficiência adaptativa em vez de pré-treinamento por força bruta — uma posição que ela enquadra como uma aposta científica em vez de um hedge comercial. Sua criação em vários países africanos e ambientes linguísticos lhe deu um interesse pessoal na questão da IA multilíngue que coexiste com o enquadramento técnico; ela descreveu a linguagem na IA como „super pessoal" e a conectou explicitamente à questão de cujo mundo interior os sistemas atuais de IA podem alcançar.


Referências