Soumith Chintala

Cocreador y líder durante mucho tiempo de PyTorch, el marco de código abierto que impulsa más del 90% de la investigación mundial en IA. Un ingeniero nacido en Hyderabad que fue rechazado por doce universidades estadounidenses para sus estudios de posgrado y que terminó construyendo la capa de software sobre la que opera la mayor parte de la IA moderna.


Perfil

Campo Detalle
Nacionalidad Indio-estadounidense
Nacimiento Hyderabad, India
Cargo actual Director de Tecnología (CTO), Thinking Machines Lab; Investigador afiliado, NYU
Áreas de investigación Infraestructura de IA, Marcos de aprendizaje profundo, Ecosistemas de código abierto, Modelos generativos, Robótica doméstica
Educación B.Tech, Tecnologías de la Información, VIT Vellore (2009); M.S., Ciencias de la Computación, NYU (~2012)
Sitio web personal soumith.ch
Blog soumith.ch/blog
X / Twitter @soumithchintala
GitHub @soumith
Google Scholar scholar.google.com

Resumen

Soumith Chintala es un ingeniero, investigador y constructor de comunidades de IA indio-estadounidense, conocido principalmente como cocreador y líder durante mucho tiempo de PyTorch, el marco de aprendizaje profundo de código abierto que construyó en FAIR de Meta a partir de 2016 y que creció hasta impulsar más del 90% de la investigación y los sistemas de producción de IA en todo el mundo. Pasó once años en Meta, y se fue en noviembre de 2025 después de dejar lo que describió como «uno de los asientos más influyentes de la industria de la IA». Luego se unió a Thinking Machines Lab, la startup de IA de Mira Murati, donde fue nombrado CTO en enero de 2026. Sus contribuciones a la investigación incluyen artículos fundacionales sobre GAN (LAPGAN, DCGAN, Wasserstein GAN), trabajo en infraestructura comunitaria (Torch-7, EBLearn, convnet-benchmarks) e investigación continua en robótica doméstica en la NYU. Su historia se cita a menudo como un ejemplo de persistencia: solicitó ingreso a doce universidades estadounidenses para su maestría y fue rechazado por todas antes de finalmente obtener admisión en la NYU, donde estudió bajo la tutela de Yann LeCun.


Primeros años y educación

Chintala creció en Hyderabad, India, y asistió a la Hyderabad Public School. Según su propio relato, tuvo dificultades con las matemáticas en sus primeros años y llegó a la computación y la resolución de problemas a través de la curiosidad autodidacta, más que por la excelencia académica. Ha descrito su camino como moldeado por una profunda atracción hacia el software de código abierto, una orientación que atribuye en parte a haber crecido sin acceso fácil a respuestas, y a descubrir que el conocimiento abierto «iguala las condiciones».

B.Tech, Tecnologías de la Información — Vellore Institute of Technology (VIT), Tamil Nadu, India, 2005–2009
Chintala completó su licenciatura en VIT Vellore, una universidad de ingeniería india de nivel medio según los estándares de la competitiva contratación tecnológica india. Después de graduarse, solicitó ingreso a doce universidades estadounidenses para una maestría en ciencias de la computación y fue rechazado por todas. En lugar de regresar a la India o abandonar el plan, se mudó a los Estados Unidos con una visa J-1 sin un camino claro a seguir, y finalmente aseguró su admisión en la NYU.

M.S., Ciencias de la Computación — New York University (~2010–2012)
En la NYU, Chintala fue supervisado por Yann LeCun, quien entonces establecía el Courant Institute de la NYU como un centro de investigación en aprendizaje profundo. Su trabajo de posgrado abarcó robótica, visión por computadora y modelado generativo temprano, e incluyó contribuciones a EBLearn, un marco de aprendizaje profundo en C++ que mantuvo junto a LeCun y Pierre Sermanet. Este período fue formativo: trabajar directamente bajo LeCun en los primeros años del renacimiento del aprendizaje profundo y contribuir a herramientas de ML de código abierto estableció tanto la profundidad técnica como la orientación comunitaria que definirían su carrera posterior.


Carrera profesional

EBLearn y trabajo temprano de código abierto (antes de 2012)

Antes y durante su maestría en la NYU, Chintala fue comantenedor de EBLearn, un marco de aprendizaje profundo en C++ desarrollado en el laboratorio de LeCun. En su apogeo, EBLearn fue una de las principales herramientas para la investigación en aprendizaje profundo, y el trabajo de Chintala en él, junto con la investigación en robótica y visión por computadora que realizó en la NYU, constituyó su entrada en el ecosistema de ML de código abierto.

Meta / Facebook AI Research (FAIR) (2014–2025)

Chintala se unió a Facebook AI Research en 2014, cuando FAIR era un pequeño equipo de aproximadamente una docena de investigadores. Ha descrito los primeros años de FAIR, particularmente 2015 y 2016, como «probablemente los años más productivos y profesionalmente agradables de mi vida», un período de trabajo en GAN, detección de objetos, bots de Starcraft e infraestructura central junto a Rob Fergus, Leon Bottou, Yann LeCun, Alec Radford y otros. Más tarde ascendió a Vicepresidente antes de irse en noviembre de 2025.

Torch-7 y convnet-benchmarks (2014–2016)
Antes de PyTorch, el marco de aprendizaje profundo de código abierto dominante utilizado por Facebook, Google DeepMind y Twitter era Torch-7, un marco basado en Lua que Chintala mantenía. También creó convnet-benchmarks, un conjunto de pruebas comparativas de redes neuronales que se convirtió en el estándar de oro utilizado por NVIDIA, AMD e Intel Nervana de 2015 a 2017 para optimizar su hardware de aprendizaje profundo. Estas contribuciones menos celebradas establecieron la práctica de la evaluación abierta, rigurosa y comparativa de sistemas de ML que luego dio forma a la filosofía de diseño de PyTorch.

LAPGAN y DCGAN (2015)
En colaboración con Remi Denton, Arthur Szlam, Rob Fergus y otros, Chintala fue coautor de LAPGAN (NIPS 2015), uno de los primeros artículos en generar imágenes fotográficas plausibles utilizando un enfoque basado en GAN, mediante una arquitectura piramidal laplaciana. El artículo complementario DCGAN (arXiv 2015, con Radford y Metz) introdujo la arquitectura GAN convolucional profunda con técnicas de estabilización del entrenamiento que hicieron que las GAN fueran prácticamente utilizables para la generación de imágenes. DCGAN se convirtió en uno de los artículos sobre GAN más citados y prácticamente lanzó la era del modelado generativo de imágenes que condujo a Stable Diffusion, DALL-E y los sistemas de generación de imágenes posteriores.

Wasserstein GAN (2017)
Coaturado con Martin Arjovsky y Leon Bottou, Wasserstein GAN introdujo la distancia de Wasserstein como objetivo de entrenamiento para las GAN, mejorando sustancialmente la estabilidad del entrenamiento y la base teórica. Chintala describió posteriormente haber abandonado las GAN «después de fracasar en convertirlas en algoritmos de entrenamiento estables», una evaluación honesta que también refleja su espíritu como ingeniero: si una técnica no se puede implementar de manera confiable, aún no merece su inversión total.

PyTorch — Cocreación y liderazgo (2016–2025)
PyTorch se creó en FAIR en 2016 y se lanzó públicamente a principios de 2017. Los contribuyentes fundadores incluyeron a Chintala, Adam Paszke, Sam Gross, Greg Chanan, Alban Desmaison, Edward Yang y otros. La filosofía de diseño clave — los grafos de cómputo dinámicos (define-by-run) en lugar de los grafos estáticos de TensorFlow — hizo que PyTorch fuera drásticamente más fácil de depurar e iterar, y la API centrada en Python redujo la barrera de entrada para los investigadores sin experiencia en programación de sistemas.

Chintala actuó como líder de facto de PyTorch durante casi ocho años, funcionando simultáneamente como gerente de producto, líder técnico, director de comunicaciones, gerente de comunidad e ingeniero de lanzamientos. Respondió miles de preguntas en el foro de PyTorch y los foros de Torch; ha descrito esta inversión en la comunidad de base como central para la forma en que se construyen los buenos productos. Bajo su administración, PyTorch creció de un prototipo de investigación al marco que impulsa prácticamente todas las empresas punteras de IA — incluido el entrenamiento de GPT, Claude, Gemini, LLaMA y Stable Diffusion —, así como implementaciones en producción en Tesla, Instagram, TikTok, Snapchat, Pinterest y los principales programas de investigación farmacéutica.

Su publicación de blog de despedida (6 de noviembre de 2025) describió a PyTorch como manejando «entrenamiento a escala exa» e impulsando «modelos fundacionales que están redefiniendo la inteligencia», y confirmó que el marco había alcanzado «más del 90% de adopción en IA». Se fue con el objetivo explícito de «hacer algo pequeño nuevamente»: escapar de la influencia de su cargo para recuperar la sensación de construir desde cero.

NYU — Investigación afiliada en robótica (2019–presente)

Junto con su rol en Meta, Chintala ha colaborado con Lerrel Pinto en la NYU en proyectos de robótica doméstica destinados a construir robots que puedan realizar tareas domésticas sin un entrenamiento exhaustivo específico para cada tarea:

  • Modelos de utilidad para robots (Robot Utility Models) — demostraron aproximadamente un 90% de precisión en cero intentos (zero-shot) en tareas básicas (abrir puertas, abrir cajones, reorientar objetos) en entornos nuevos no vistos.
  • Sobre llevar robots a casa (DobbE) — 109 tareas, probadas en 10 hogares de Nueva York, con una tasa de éxito del 81%, y 20 minutos necesarios para aprender una tarea nueva.
  • Trabajo adicional sobre representaciones táctiles, manipulación diestra y sistemas de memoria semántica para robots domésticos.

Thinking Machines Lab — CTO (noviembre de 2025–presente)

Después de dejar Meta en noviembre de 2025, Chintala se unió a Thinking Machines Lab de Mira Murati, anunciando simplemente: «máquinas pensantes… la gente es increíble». En enero de 2026, tras la salida de Barret Zoph (que regresó a OpenAI), Murati nombró a Chintala como CTO. Murati lo describió como «un líder brillante y experimentado» con más de una década de contribuciones fundacionales a la infraestructura de IA. Su enfoque actual está en la infraestructura de IA, la investigación en IA y la robótica en Thinking Machines.


Contribuciones clave

  • PyTorch — Cocreado y liderado durante casi ocho años; el marco de aprendizaje profundo de código abierto utilizado ahora por más del 90% de los investigadores de IA en todo el mundo y que impulsa prácticamente todos los sistemas de IA punteros en producción. El diseño de grafo de cómputo dinámico y la API centrada en Python que Chintala defendió establecieron el paradigma dominante para el diseño de marcos de ML.

  • DCGAN (arXiv 2015, con Radford y Metz) — Introdujo la arquitectura GAN convolucional profunda con técnicas de estabilización del entrenamiento (normalización por lotes, elecciones de activación específicas) que hicieron que las GAN fueran prácticamente útiles; uno de los artículos de modelado generativo más citados y la base para la década siguiente de investigación en generación de imágenes.

  • LAPGAN (NIPS 2015) — Una de las primeras demostraciones de síntesis de imágenes fotorrealistas mediante GAN, utilizando un enfoque piramidal laplaciano; ayudó a establecer el modelado generativo basado en GAN como una dirección de investigación viable.

  • Wasserstein GAN (ICML 2017) — Introdujo el objetivo de entrenamiento de la distancia de Wasserstein para las GAN, mejorando sustancialmente la estabilidad del entrenamiento y proporcionando una base teórica; fundamental para la metodología de entrenamiento de GAN posterior.

  • Torch-7 — Mantuvo el marco de aprendizaje profundo basado en Lua anterior a PyTorch utilizado por Google DeepMind, Twitter y Meta; el predecesor directo de PyTorch y la plataforma comunitaria en la que se probaron por primera vez las ideas de diseño de PyTorch.

  • convnet-benchmarks — Creó el conjunto de pruebas comparativas estándar de oro para el aprendizaje profundo (2015–2017) utilizado por NVIDIA, AMD e Intel Nervana para optimizar su hardware; un ejemplo temprano e influyente de evaluación abierta y comparativa de sistemas de ML.

  • EBLearn — Comantenedor del marco de aprendizaje profundo en C++ con Yann LeCun y Pierre Sermanet antes de 2012; uno de los precursores del ecosistema moderno de marcos de ML.

  • Robótica doméstica (con Lerrel Pinto, NYU) — Demostró rendimiento en cero intentos (zero-shot) en tareas domésticas (Modelos de utilidad para robots) y aprendizaje escalable a partir de la demostración en hogares reales (DobbE) — contribuyó a la base de evidencia para robots domésticos desplegables.


Premios y reconocimientos

  • TIME100 AI — Incluido en la lista de la revista Time de las personas más influyentes en IA.
  • Ampliamente acreditado por haber hecho posible la era moderna de la IA a través del papel de PyTorch en el entrenamiento de GPT, Claude, LLaMA, Stable Diffusion y la mayoría de los demás modelos punteros.
  • Impacto comunitario de PyTorch — La administración de PyTorch por parte de Chintala durante 8 años es ampliamente reconocida como una de las contribuciones individuales más trascendentales a la infraestructura de IA; descrita por colegas como «la capa de software que impulsa toda la industria de la IA».

Relaciones clave

  • Yann LeCun — Asesor de posgrado en la NYU; empleó a Chintala en FAIR; acreditado por Chintala junto a Rob Fergus por «construir el FAIR mágico de los primeros tiempos». El apoyo temprano de LeCun a un estudiante de una institución no prestigiosa, y su colaboración sostenida con Chintala en FAIR, fue decisivo en la trayectoria de Chintala.
  • Adam Paszke — Cocreador central de PyTorch; en ese momento, un estudiante de licenciatura en Polonia que contribuyó al código base de PyTorch y fue invitado a hacer una pasantía en FAIR; un ejemplo de la apertura de Chintala a los contribuyentes independientemente de sus credenciales.
  • Alec Radford — Colega de FAIR y coautor de DCGAN; el período de investigación sobre GAN en FAIR produjo algunos de los primeros trabajos más citados de ambos investigadores.
  • Martin Arjovsky y Leon Bottou — Coautores de Wasserstein GAN; Bottou es un investigador senior de FAIR y uno de los padres matemáticos del campo.
  • Mira Murati — Empleadora actual y CEO de Thinking Machines Lab; nombró a Chintala como CTO en enero de 2026.
  • Lerrel Pinto — Colaborador en la NYU en robótica doméstica; su trabajo conjunto representa el enfoque de investigación más sostenido de Chintala fuera de la infraestructura de ML.
  • Mark Zuckerberg y Mike Schroepfer (Schrep) — La publicación de despedida de Chintala les agradeció explícitamente por «creer que el código abierto es fundamentalmente importante y una estrategia empresarial sólida» — enmarcando el código abierto como una convicción compartida más que como una política de arriba abajo.

Estilo personal

Los valores profesionales de Chintala se pueden leer directamente en la lista de principios de su sitio web personal: «abraza la pereza» (automatiza todo lo no deseado), «abraza la simplicidad», «evita los problemas de juguete o hipotéticos» y «ama rabiosamente el código abierto». El último punto es el más biográfico: atribuye su compromiso con el código abierto a haber crecido sin acceso fácil al conocimiento y a ver la publicación abierta de herramientas como una forma de «igualar las condiciones». Su estilo de gestión comunitaria — responder miles de preguntas en foros, mantenerse accesible, dar la bienvenida a contribuciones de estudiantes de licenciatura en Polonia y estudiantes de posgrado en NeurIPS — refleja el mismo instinto igualitario que hizo prosperar a la comunidad de PyTorch. Su descripción de dejar Meta captura una tensión que recorre toda su carrera: el tirón entre la influencia institucional (liderar el marco que ejecuta toda la IA) y la libertad creativa de construir algo pequeño e incómodo. Su decisión de irse en favor de la curiosidad, en lugar de quedarse por el poder, es consistente con los valores que ha articulado a lo largo del tiempo.


Referencias