François Chollet

Investigador de IA nascido em França, engenheiro de código aberto e cofundador da Ndea, mais conhecido como criador do Keras e arquiteto do benchmark ARC-AGI para medir a inteligência geral.


Perfil

Nascimento 20 de outubro de 1989, França
Nacionalidade Francesa
Instituição atual Ndea (cofundador); ARC Prize Foundation (cofundador)
Áreas de investigação Aprendizagem profunda, Visão computacional, Abstração, Raciocínio formal, Inteligência geral artificial, Síntese de programas
Formação Diplôme d’Ingénieur (MEng), ENSTA Paris / Instituto Politécnico de Paris (2012)
Site pessoal fchollet.com
X / Twitter @fchollet
GitHub fchollet
Google Scholar François Chollet — citado mais de 73 000 vezes
Substack fchollet.substack.com

Visão geral

François Chollet é um engenheiro de software e investigador de IA francês cuja década na Google produziu dois dos artefactos mais consequentes na aprendizagem profunda moderna: o framework Keras, que se tornou a API de alto nível dominante para construir redes neurais em todo o mundo, e o benchmark ARC-AGI, que redefiniu a forma como a área mede o progresso em direção à inteligência geral. A sua arquitetura Xception está entre os dez artigos mais citados nas atas da CVPR, com mais de 18 000 citações, e o seu livro Deep Learning with Python vendeu mais de 100 000 exemplares. Após mais de nove anos na Google, saiu em novembro de 2024 para cofundar a Ndea, um laboratório de investigação que visa a AGI através de síntese de programas guiada por aprendizagem profunda, juntamente com a ARC Prize Foundation, uma organização sem fins lucrativos que estabeleceu para coordenar e financiar a investigação aberta em direção à inteligência geral. É um dos mais proeminentes céticos da área quanto à visão de que a escalabilidade de grandes modelos de linguagem será suficiente para a AGI.


Infância e educação

Chollet nasceu em França a 20 de outubro de 1989. Licenciou-se em 2012 com um Diplôme d’Ingénieur (equivalente a um Mestrado em Engenharia) pela ENSTA Paris, uma grande école do Instituto Politécnico de Paris. Os seus primeiros projetos independentes após a licenciatura mostraram uma amplitude técnica invulgarmente ampla: construiu o Wysp, uma rede social e plataforma de aprendizagem para artistas que atingiu cerca de 25 000 utilizadores ativos mensais em 2014-2015, e o QuickAnswers.io, um motor de resposta a perguntas que utilizava uma técnica — normalizar consultas, executar pesquisas na web, extrair excertos relevantes e passá-los a um modelo de linguagem LSTM — que mais tarde seria chamada de Geração Aumentada por Recuperação (RAG). Ambos os projetos refletiam um interesse precoce em sistemas que ajudam as pessoas a aprender e a ganhar maior capacidade de ação, um tema que se repetiria ao longo da sua carreira.


Carreira

Google (2015–2024)

Em 2015, Chollet começou a trabalhar na Google pouco depois de lançar o Keras. Exerceu funções de Senior Staff Engineer, com responsabilidade principal sobre o Keras, além de contribuir para o TensorFlow e projetos de investigação mais amplos da Google Brain.

Keras. Lançado a 27 de março de 2015, o Keras foi concebido como uma API de redes neurais de alto nível orientada para o utilizador. A sua filosofia explícita — de que o design de API é uma forma de design de UX, e que o tempo e a carga cognitiva dos programadores são importantes — tornou-o na camada de entrada dominante para profissionais e investigadores de aprendizagem profunda numa altura em que a interface de baixo nível do TensorFlow era uma barreira significativa à entrada. O Keras foi posteriormente adotado como a API oficial de alto nível do TensorFlow e tem alimentado o desenvolvimento de IA em empresas como YouTube, Waymo, Spotify, Uber e Netflix. Com o Keras 3 (2023), tornou-se agnóstico em relação ao backend, suportando TensorFlow, JAX e PyTorch.

Xception. O seu artigo de 2016 Xception: Deep Learning with Depthwise Separable Convolutions, publicado na CVPR 2017, propôs substituir as camadas convolucionais padrão por convoluções separáveis em profundidade — uma ideia que estava implícita nas arquiteturas Inception mas que Chollet formalizou e levou à sua conclusão lógica. O artigo está entre os dez mais citados nas atas da CVPR, com mais de 18 000 citações, e influenciou arquiteturas subsequentes, incluindo MobileNet e EfficientNet.

Investigação em raciocínio formal. Paralelamente ao trabalho no framework, Chollet contribuiu para o programa da Google sobre aprendizagem profunda aplicada ao raciocínio matemático, incluindo DeepMath (NeurIPS 2016, com Alemi, Szegedy et al.) sobre seleção de premissas para demonstração de teoremas, e HolStep (ICLR 2017, com Kaliszyk e Szegedy), um conjunto de dados de aprendizagem automática para lógica de ordem superior. Também foi coautor de trabalhos sobre convoluções separáveis em profundidade para tradução automática neural (ICLR 2017, com Kaiser e Gomez) e contribuiu para a biblioteca Tensor2Tensor.

Benchmark ARC-AGI. Em 2019, Chollet publicou On the Measure of Intelligence (arXiv 1911.01547), um artigo teórico que formalizou uma definição de inteligência como eficiência na aquisição de competências em tarefas novas, e introduziu o Corpus de Abstração e Raciocínio (ARC-AGI) como benchmark. O ARC-AGI foca-se na inteligência fluida — a capacidade de raciocinar e resolver problemas novos — em vez da inteligência cristalizada baseada em conhecimento acumulado, e restringe-se a priores de conhecimento nuclear presentes em todos os seres humanos desde o desenvolvimento inicial. O benchmark foi especificamente concebido para ser fácil para humanos e difícil para sistemas de IA que dependem de interpolação sobre dados de treino.

Em 2024, Chollet lançou o ARC Prize, uma competição de 1 milhão de dólares americanos para resolver o benchmark ARC-AGI. A competição atraiu atenção significativa quando o modelo o3 da OpenAI alcançou cerca de 87% no ARC-AGI-1 com alto poder computacional, o que Chollet reconheceu como um avanço significativo e consistente com a direção de procura de programas que defendia. A série ARC Prize expandiu-se desde então para ARC-AGI-2 e ARC-AGI-3, iterações progressivamente mais difíceis.

Chollet saiu da Google em novembro de 2024, após mais de 9 anos.

Ndea / ARC Prize Foundation (2025–presente)

Em janeiro de 2025, Chollet cofundou a Ndea com Mike Knoop, cofundador da Zapier, como um novo laboratório de investigação em IA com o objetivo declarado de construir AGI através de síntese de programas guiada por aprendizagem profunda. O nome Ndea inspira-se nos conceitos gregos de compreensão intuitiva (ennoia) e raciocínio lógico (dianoia), refletindo a sua abordagem técnica dupla. A Ndea é totalmente remota e está a montar o que descreve como uma equipa de investigação em síntese de programas de classe mundial. No início de 2025, Chollet também expandiu o ARC Prize para uma fundação sem fins lucrativos de pleno direito para orientar e acelerar o progresso da investigação em direção à AGI.


Contribuições principais

  • Keras — Criou e liderou o framework de aprendizagem profunda em Python lançado em março de 2015, agora uma das bibliotecas de aprendizagem profunda mais utilizadas em todo o mundo. A sua filosofia centrada no utilizador e na API estabeleceu um novo padrão para a acessibilidade das ferramentas de ML. O Keras 3 estendeu-o para suportar os backends TensorFlow, JAX e PyTorch.

  • Xception: Deep Learning with Depthwise Separable Convolutions (CVPR 2017) — Entre os dez artigos mais citados nas atas da CVPR, com mais de 18 000 citações. Formalizou o princípio arquitetónico subjacente a muitas das redes convolucionais mais eficientes da década seguinte.

  • Benchmark ARC-AGI (On the Measure of Intelligence, arXiv 2019) — Propôs uma definição rigorosa e operacional de inteligência como eficiência na aquisição de competências e introduziu o conjunto de tarefas ARC-AGI como instrumento de medição. Tornou-se o benchmark de referência de facto para avaliar o raciocínio de propósito geral em sistemas de IA.

  • ARC Prize (2024–presente) — Uma competição de 1 milhão de dólares americanos lançada em 2024 para acelerar o progresso aberto no ARC-AGI, posteriormente expandida para uma fundação (ARC Prize Foundation) e uma série evolutiva de benchmarks (ARC-AGI-1, 2, 3).

  • Deep Learning with Python (Manning, 2017; 2.ª ed. 2021; 3.ª ed. 2025) — Vendeu mais de 100 000 exemplares e foi traduzido para pelo menos doze línguas; um dos manuais introdutórios mais lidos na área.

  • DeepMath (NeurIPS 2016) — Coautor com Alemi, Szegedy et al.; aplicou modelos de sequência profunda à seleção de premissas para demonstração formal de teoremas, uma demonstração precoce de aprendizagem profunda em tarefas de raciocínio matemático.

  • HolStep (ICLR 2017) — Coautor com Kaliszyk e Szegedy; introduziu um conjunto de dados em grande escala para investigação em aprendizagem automática sobre demonstração de teoremas em lógica de ordem superior.

  • QuickAnswers.io (2014, descontinuado) — Um protótipo inicial de geração aumentada por recuperação (RAG) construído anos antes do termo ser cunhado, que normalizava as consultas dos utilizadores, recuperava excertos da web e gerava respostas contextuais através de um modelo de linguagem LSTM.

  • Keras Tuner — Biblioteca de código aberto para ajuste de hiperparâmetros do Keras, lançada em 2019, simplificando a procura de arquiteturas neurais para profissionais.


Prémios e reconhecimento

  • TIME100 AI (2024) — Nomeado pela TIME como uma das 100 pessoas mais influentes na IA.
  • Global Swiss AI Award (dezembro de 2021) — Premiado por avanços na IA.
  • Citações no Google Scholar — Mais de 73 000 citações totais em todas as publicações.
  • Artigos mais citados da CVPR — Xception está entre os dez artigos mais citados na história da CVPR.
  • Adoção do Keras — O framework é utilizado em produção por grandes empresas e tem sido a ferramenta de eleição para ensinar aprendizagem profunda em centenas de cursos universitários em todo o mundo.

Relações principais

  • Mike Knoop — Cofundador da Ndea e do ARC Prize; cofundador da Zapier que traz experiência em construção de sistemas e produto para o empreendimento.
  • Christian Szegedy — Colaborador frequente em investigação na Google sobre raciocínio formal, demonstração de teoremas e fundamentos matemáticos da aprendizagem profunda (DeepMath, HolStep).
  • Łukasz Kaiser — Coautor em convoluções separáveis em profundidade para tradução automática neural e na biblioteca Tensor2Tensor.
  • J. J. Allaire — Coautor de Deep Learning with R (Manning, 2018); a colaboração estendeu a missão educacional de Chollet à comunidade de computação estatística da linguagem R.
  • Jeff Dean — Como chefe da Google Brain, defendeu a integração do Keras como API oficial de alto nível do TensorFlow, ampliando substancialmente o alcance do Keras.
  • Lex Fridman — Apresentou duas conversas longas com Chollet (2019, 2020) que expuseram o seu pensamento sobre os limites da aprendizagem profunda e a natureza da inteligência a um vasto público.
  • Elizabeth Spelke — Psicóloga do desenvolvimento de Harvard cuja teoria do Conhecimento Nuclear de priores cognitivos inatos informa diretamente a filosofia de design do ARC-AGI, citada explicitamente na fundamentação do benchmark.

Estilo pessoal

Chollet é um ensaísta invulgarmente fundamentado num campo muitas vezes dominado pela perseguição de benchmarks e anúncios de produtos: ensaios como