Soumith Chintala

ref · 25 Maio , 2026 07:53

Co-criador e líder de longa data do PyTorch, o framework de código aberto que alimenta mais de 90% da pesquisa de IA no mundo — um engenheiro nascido em Hyderabad que foi rejeitado por doze universidades americanas para a pós-graduação e passou a construir a camada de software sobre a qual a maior parte da IA moderna é executada.

Perfil

Campo	Detalhe
Nacionalidade	Indiano-Americano
Nascimento	Hyderabad, Índia
Cargo Atual	CTO, Thinking Machines Lab; Pesquisador Afiliado, NYU
Áreas de Pesquisa	Infraestrutura de IA, Frameworks de Deep Learning, Ecossistemas de Código Aberto, Modelos Generativos, Robótica Doméstica
Formação	B.Tech, Tecnologia da Informação, VIT Vellore (2009); M.S., Ciência da Computação, NYU (~2012)
Site Pessoal	soumith.ch
Blog	soumith.ch/blog
X / Twitter	@soumithchintala
GitHub	@soumith
Google Scholar	scholar.google.com

Visão Geral

Soumith Chintala é um engenheiro, pesquisador e construtor de comunidades indiano-americano de IA, mais conhecido como co-criador e líder de longa data do PyTorch — o framework de deep learning de código aberto que ele construiu no FAIR da Meta a partir de 2016 e que cresceu para alimentar mais de 90% da pesquisa e dos sistemas de produção de IA em todo o mundo. Ele passou onze anos na Meta, saindo em novembro de 2025 após deixar o que descreveu como “um dos assentos mais alavancados da indústria de IA”. Em seguida, juntou-se à Thinking Machines Lab, a startup de IA de Mira Murati, onde foi nomeado CTO em janeiro de 2026. Suas contribuições de pesquisa incluem artigos fundamentais sobre GANs (LAPGAN, DCGAN, Wasserstein GAN), trabalho em infraestrutura comunitária (Torch-7, EBLearn, convnet-benchmarks) e pesquisa contínua em robótica doméstica na NYU. Sua história é amplamente citada como uma ilustração de persistência: ele se candidatou a doze universidades americanas para seu mestrado e foi rejeitado por todas antes de eventualmente conseguir admissão na NYU, onde estudou sob a orientação de Yann LeCun.

Primeiros Anos e Educação

Chintala cresceu em Hyderabad, na Índia, estudando na Hyderabad Public School. Por sua própria conta, ele teve dificuldades com matemática nos primeiros anos e chegou à computação e à resolução de problemas através da curiosidade autodidata, e não da excelência acadêmica. Ele descreveu seu caminho como moldado por uma profunda atração por software de código aberto — uma orientação que ele atribui em parte ao fato de ter crescido sem acesso a respostas, e de descobrir que o conhecimento aberto “nivela o campo de jogo”.

B.Tech, Tecnologia da Informação — Vellore Institute of Technology (VIT), Tamil Nadu, Índia, 2005–2009
Chintala completou sua graduação no VIT Vellore, uma faculdade de engenharia indiana de nível médio pelos padrões de recrutamento competitivo de tecnologia indiano. Após se formar, candidatou-se a doze universidades americanas para um mestrado em ciência da computação — e foi rejeitado por todas. Em vez de voltar para a Índia ou abandonar o plano, mudou-se para os Estados Unidos com um visto J-1 sem um caminho claro pela frente e, eventualmente, conseguiu admissão na NYU.

M.S., Ciência da Computação — New York University (~2010–2012)
Na NYU, Chintala foi supervisionado por Yann LeCun, que então estabelecia o Courant Institute da NYU como um centro de pesquisa em deep learning. Seu trabalho de pós-graduação abrangeu robótica, visão computacional e modelagem generativa inicial, e incluiu contribuições para o EBLearn — um framework de deep learning em C++ que ele mantinha junto com LeCun e Pierre Sermanet. Este período foi formativo: trabalhar diretamente sob LeCun nos primeiros anos do renascimento do deep learning e contribuir para ferramentas de ML de código aberto estabeleceu tanto a profundidade técnica quanto a orientação comunitária que definiriam sua carreira subsequente.

Carreira

EBLearn e Primeiros Trabalhos em Código Aberto (pré-2012)

Antes e durante seu mestrado na NYU, Chintala co-manteve o EBLearn, um framework em C++ para deep learning desenvolvido no laboratório de LeCun. No seu auge, o EBLearn era uma das principais ferramentas para pesquisa em deep learning, e o trabalho de Chintala nele — juntamente com a pesquisa em robótica e visão computacional que conduziu na NYU — constituiu sua entrada no ecossistema de ML de código aberto.

Meta / Facebook AI Research (FAIR) (2014–2025)

Chintala entrou para o Facebook AI Research em 2014, quando o FAIR era uma pequena equipe de cerca de uma dúzia de pesquisadores. Ele descreveu os primeiros anos do FAIR — 2015 e 2016 em particular — como “provavelmente os anos mais produtivos e profissionalmente agradáveis da minha vida”, um período de trabalho em GANs, detecção de objetos, bots de Starcraft e infraestrutura central ao lado de Rob Fergus, Leon Bottou, Yann LeCun, Alec Radford e outros. Mais tarde, tornou-se Vice-Presidente antes de sair em novembro de 2025.

Torch-7 e convnet-benchmarks (2014–2016)
Antes do PyTorch, o framework de deep learning de código aberto dominante usado pelo Facebook, Google DeepMind e Twitter era o Torch-7 — um framework baseado em Lua que Chintala mantinha. Ele também criou o convnet-benchmarks, um conjunto de benchmarks para redes neurais que se tornou o padrão ouro usado pela NVIDIA, AMD e Intel Nervana de 2015 a 2017 para otimizar seu hardware de deep learning. Essas contribuições menos celebradas estabeleceram a prática de avaliação rigorosa, comparativa e aberta de sistemas de ML que mais tarde moldou a filosofia de design do PyTorch.

LAPGAN e DCGAN (2015)
Em colaboração com Remi Denton, Arthur Szlam, Rob Fergus e outros, Chintala co-escreveu o LAPGAN (NIPS 2015) — um dos primeiros artigos a gerar imagens fotográficas plausíveis usando uma abordagem baseada em GAN, utilizando uma arquitetura de pirâmide laplaciana. O artigo complementar DCGAN (arXiv 2015, com Radford e Metz) introduziu a arquitetura GAN convolucional profunda com técnicas de estabilização de treinamento que tornaram as GANs praticamente utilizáveis para geração de imagens. O DCGAN se tornou um dos artigos sobre GANs mais citados e efetivamente lançou a era da modelagem generativa de imagens que levou ao Stable Diffusion, DALL-E e sistemas subsequentes de geração de imagens.

Wasserstein GAN (2017)
Co-escrito com Martin Arjovsky e Leon Bottou, o Wasserstein GAN introduziu a distância de Wasserstein como um objetivo de treinamento para GANs, melhorando substancialmente a estabilidade do treinamento e o embasamento teórico. Chintala subsequentemente descreveu ter desistido das GANs “após falhar em torná-las algoritmos de treinamento estáveis” — uma avaliação honesta que também reflete seu ethos de engenharia: se uma técnica não pode ser implantada de forma confiável, ela ainda não merece seu investimento total.

PyTorch — Cocriação e Liderança (2016–2025)
O PyTorch foi criado no FAIR em 2016 e lançado publicamente no início de 2017. Os contribuidores fundadores incluíram Chintala, Adam Paszke, Sam Gross, Greg Chanan, Alban Desmaison, Edward Yang e outros. A filosofia de design principal — grafos computacionais dinâmicos (define-by-run) em vez dos grafos estáticos do TensorFlow — tornou o PyTorch dramaticamente mais fácil de depurar e iterar, e a API em primeiro lugar em Python reduziu a barreira de entrada para pesquisadores sem experiência em programação de sistemas.

Chintala serviu como o líder de fato do PyTorch por quase oito anos, funcionando simultaneamente como gerente de produto, líder técnico, diretor de comunicações, gerente de comunidade e engenheiro de releases. Ele respondeu a milhares de perguntas no fórum do PyTorch e nos fóruns do Torch; ele descreveu esse investimento comunitário de base como central para a construção de bons produtos. Sob sua gestão, o PyTorch cresceu de um protótipo de pesquisa para o framework que alimenta praticamente todas as empresas de IA de fronteira — incluindo o treinamento do GPT, Claude, Gemini, LLaMA e Stable Diffusion — bem como implantações de produção na Tesla, Instagram, TikTok, Snapchat, Pinterest e importantes programas de pesquisa farmacêutica.

Seu post de despedida no blog (6 de novembro de 2025) descreveu o PyTorch como lidando com “treinamento em exaescala” e alimentando “modelos fundamentais que estão redefinindo a inteligência”, e confirmou que o framework havia alcançado “mais de 90% de adoção em IA”. Ele saiu com o objetivo explícito de “fazer algo pequeno de novo” — escapar da alavancagem de seu papel para recuperar a sensação de construir a partir do zero.

NYU — Pesquisa Afiliada em Robótica (2019–presente)

Paralelamente ao seu papel na Meta, Chintala colaborou com Lerrel Pinto na NYU em projetos de robótica doméstica com o objetivo de construir robôs que possam realizar tarefas domésticas sem treinamento exaustivo específico para a tarefa:

Robot Utility Models — demonstrou ~90% de precisão zero-shot em tarefas básicas (abrir porta, abrir gaveta, reposicionar objetos) em novos ambientes nunca vistos.
On Bringing Robots Home (DobbE) — 109 tarefas, testadas em 10 residências em Nova York, 81% de taxa de sucesso, com 20 minutos necessários para aprender uma nova tarefa.
Trabalho adicional em representações táteis, manipulação dextra e sistemas de memória semântica para robôs domésticos.

Thinking Machines Lab — CTO (novembro de 2025–presente)

Após deixar a Meta em novembro de 2025, Chintala juntou-se à Thinking Machines Lab, de Mira Murati, anunciando simplesmente: “thinking machines…as pessoas são incríveis.” Em janeiro de 2026, após a saída de Barret Zoph (que retornou à OpenAI), Murati nomeou Chintala como CTO. Murati o descreveu como “um líder brilhante e experiente” com mais de uma década de contribuições fundamentais para a infraestrutura de IA. Seu foco atual está em infraestrutura de IA, pesquisa de IA e robótica na Thinking Machines.

Principais Contribuições

PyTorch — Co-criou e liderou por quase oito anos; o framework de deep learning de código aberto agora usado por mais de 90% dos pesquisadores de IA em todo o mundo e alimentando praticamente todos os sistemas de IA de fronteira em produção. O design de grafo computacional dinâmico e a API em primeiro lugar em Python que Chintala defendeu estabeleceram o paradigma dominante para o design de frameworks de ML.
DCGAN (arXiv 2015, com Radford e Metz) — Introduziu a arquitetura GAN convolucional profunda com técnicas de estabilização de treinamento (normalização em lote, escolhas específicas de ativação) que tornaram as GANs praticamente úteis; um dos artigos de modelagem generativa mais citados e a base para a década subsequente de pesquisa em geração de imagens.
LAPGAN (NIPS 2015) — Uma das primeiras demonstrações de síntese de imagem fotorrealista usando GANs, utilizando uma abordagem de pirâmide laplaciana; ajudou a estabelecer a modelagem generativa baseada em GAN como uma direção de pesquisa viável.
Wasserstein GAN (ICML 2017) — Introduziu o objetivo de treinamento da distância de Wasserstein para GANs, melhorando substancialmente a estabilidade do treinamento e fornecendo embasamento teórico; fundamental para a metodologia subsequente de treinamento de GANs.
Torch-7 — Manteve o framework de deep learning baseado em Lua anterior ao PyTorch usado pelo Google DeepMind, Twitter e Meta; o predecessor direto do PyTorch e a plataforma comunitária na qual as ideias de design do PyTorch foram testadas pela primeira vez.
convnet-benchmarks — Criou o conjunto de benchmarks padrão ouro para deep learning (2015–2017) usado pela NVIDIA, AMD e Intel Nervana para otimizar seu hardware; um exemplo inicial e influente de avaliação aberta e comparativa de sistemas de ML.
EBLearn — Co-manteve o framework de deep learning em C++ com Yann LeCun e Pierre Sermanet antes de 2012; um dos precursores do ecossistema moderno de frameworks de ML.
Robótica Doméstica (com Lerrel Pinto, NYU) — Demonstrou desempenho zero-shot em tarefas domésticas (Robot Utility Models) e aprendizado escalável a partir de demonstração em residências reais (DobbE) — contribuiu para a base de evidências para robôs domésticos implantáveis.

Prêmios e Reconhecimento

TIME100 AI — Incluído na lista da revista Time das pessoas mais influentes em IA.
Amplamente creditado por possibilitar a era moderna da IA através do papel do PyTorch no treinamento do GPT, Claude, LLaMA, Stable Diffusion e a maioria dos outros modelos de fronteira.
Impacto Comunitário do PyTorch — A gestão de 8 anos do PyTorch por Chintala é amplamente reconhecida como uma das contribuições individuais mais consequentes para a infraestrutura de IA; descrito por colegas como “a camada de software que alimenta toda a indústria de IA”.

Relacionamentos Chave

Yann LeCun — Orientador de pós-graduação na NYU; empregou Chintala no FAIR; creditado por Chintala ao lado de Rob Fergus por “construir o mágico FAIR inicial”. O apoio precoce de LeCun a um aluno de uma instituição não prestigiada, e sua colaboração sustentada com Chintala no FAIR, foi decisivo na trajetória de Chintala.
Adam Paszke — Co-criador central do PyTorch; na época, um graduando na Polônia que contribuiu para o código do PyTorch e foi convidado a estagiar no FAIR — um exemplo da abertura de Chintala a contribuidores independentemente de credenciais.
Alec Radford — Colega do FAIR e coautor do DCGAN; o período de pesquisa em GANs no FAIR produziu alguns dos primeiros trabalhos mais citados de ambos os pesquisadores.
Martin Arjovsky e Leon Bottou — Coautores do Wasserstein GAN; Bottou é um pesquisador sênior do FAIR e um dos pais matemáticos da área.
Mira Murati — Empregadora atual e CEO da Thinking Machines Lab; nomeou Chintala como CTO em janeiro de 2026.
Lerrel Pinto — Colaborador da NYU em robótica doméstica; seu trabalho conjunto representa o foco de pesquisa mais sustentado de Chintala fora da infraestrutura de ML.
Mark Zuckerberg e Mike Schroepfer (Schrep) — O post de despedida de Chintala explicitamente creditou ambos por “acreditarem que o código aberto é fundamentalmente importante e é uma estratégia de negócios sólida” — enquadrando o código aberto como uma convicção compartilhada, e não uma política de cima para baixo.

Estilo Pessoal

Os valores profissionais de Chintala podem ser lidos diretamente na lista de princípios de seu site pessoal: ele “abraça a preguiça” (automatize tudo o que não é desejado), “abraça a simplicidade”, “evita problemas hipotéticos ou de brinquedo” e “ama raivosamente o código aberto”. O último ponto é o mais biográfico: ele atribui seu compromisso com o código aberto ao fato de ter crescido sem acesso fácil ao conhecimento e ver a publicação aberta de ferramentas como uma forma de “nivelar o campo de jogo”. Seu estilo de gestão comunitária — responder a milhares de perguntas no fórum, permanecer acessível, receber contribuições de graduandos na Polônia e estudantes de pós-graduação no NeurIPS — reflete o mesmo instinto igualitário que fez a comunidade do PyTorch prosperar. Sua descrição de deixar a Meta captura uma tensão que percorre toda a sua carreira: a atração entre a alavancagem institucional (liderar o framework que executa toda a IA) e a liberdade criativa de construir algo pequeno e desconfortável. Sua decisão de sair em favor da curiosidade, em vez de ficar pelo poder, é consistente com os valores que ele articulou ao longo de todo o percurso.