Probabilista canadiense e investigador de deep learning en la Universidad de Toronto, cuyo artículo sobre Neural ODE estableció las redes de profundidad continua como una nueva clase y cuya biblioteca Autograd dio origen al ecosistema de diferenciación automática que luego produjo JAX — y que desde entonces se ha volcado hacia la gobernanza de la IAG, las evaluaciones de sabotaje y el riesgo sistémico de la deshumanización gradual.
Perfil
| Nacionalidad | Canadiense |
| Institución(es) actual(es) | Universidad de Toronto — Profesor Asociado, Cs. de la Computación y Estadística; Cátedra Schwartz Reisman en Tecnología y Sociedad; Vector Institute (Miembro Fundador) |
| Áreas de investigación | Gobernanza de la IAG, Seguridad de la IA, Evaluación de Riesgos Catastróficos, Modelos Probabilísticos Profundos, Neural ODEs, Modelos Generativos, Diferenciación Automática |
| Director de doctorado | Carl Rasmussen; Zoubin Ghahramani |
| Tesis doctoral | Automatic Model Construction with Gaussian Processes (Universidad de Cambridge, 2014) |
| Sitio web | cs.toronto.edu/~duvenaud |
| X / Twitter | @DavidDuvenaud |
| GitHub | duvenaud |
| Google Scholar | David Duvenaud |
Resumen
David Duvenaud es un investigador canadiense de aprendizaje automático y profesor asociado en la Universidad de Toronto, donde ocupa la Cátedra Schwartz Reisman en Tecnología y Sociedad y es miembro fundador del Vector Institute. Completó su doctorado en Cambridge bajo la supervisión de Carl Rasmussen y Zoubin Ghahramani, un posdoctorado en Harvard con Ryan Adams, y está en Toronto desde 2016. Su carrera sigue una llamativa trayectoria de tres fases: desde la teoría de procesos gaussianos y el modelado probabilístico en Cambridge; pasando por las redes neuronales de profundidad continua, la diferenciación automática y los modelos generativos profundos en Toronto (que culminaron con el Premio al Mejor Artículo de NeurIPS 2018 por Neural ODEs y las contribuciones fundacionales a Autograd, el precursor de JAX); hasta un giro casi completo, tras un sabático prolongado en el equipo de Alignment Science de Anthropic, hacia la gobernanza de la IAG, la evaluación de modelos frontera y el riesgo estructural de que el despliegue incremental de la IA pueda desempoderar gradualmente a la humanidad. Continúa supervisando estudiantes de doctorado y enseñando en Toronto, centrado actualmente por completo en la agenda de alineamiento y seguridad que emprendió en Anthropic.
Primeros años y educación
Universidad de Columbia Británica — M.Sc. (2010)
Duvenaud completó una Maestría en Ciencias en la UBC bajo la dirección de Kevin Murphy, trabajando en campos aleatorios condicionales multiescala para el etiquetado de imágenes semisupervisado. Su tesis de maestría estableció su interés en los modelos gráficos probabilísticos y la estructura de variables latentes.
Universidad de Cambridge — Doctorado (2010–2014)
En el Grupo de Aprendizaje Automático de Cambridge, Duvenaud trabajó con Carl Rasmussen y Zoubin Ghahramani — dos de las figuras centrales en la investigación de procesos gaussianos — en el problema de la construcción automática de modelos. Su disertación, Automatic Model Construction with Gaussian Processes, introdujo una gramática sobre los kernels de GP que un programa podía buscar para identificar la estructura estadísticamente apropiada en un conjunto de datos, produciendo informes legibles por humanos que describían el modelo ajustado. El proyecto fue un prototipo de lo que se convertiría en la agenda de investigación del Automatic Statistician. Sus componentes clave — el artículo sobre búsqueda de kernels composicionales (ICML 2013), la descripción automática en lenguaje natural de la regresión no paramétrica (AAAI 2014), y el trabajo sobre GP aditivos y GP profundos — siguen siendo ampliamente citados. Durante el doctorado, coorganizó la serie de talleres de Numerical Probability, conectando el análisis numérico con la inferencia bayesiana.
Grupo HIPS de Harvard — Posdoctorado (2014–2016)
Después de Cambridge, Duvenaud se unió al grupo Harvard Intelligent Probabilistic Systems (HIPS) como posdoc con Ryan Adams. Este período produjo varias contribuciones duraderas. La primera fue Autograd — desarrollado principalmente por Dougal Maclaurin junto a Duvenaud y Matthew Johnson — una biblioteca para la diferenciación automática en modo inverso de Python nativo y NumPy, que admitía bucles, condicionales, clausuras y derivadas de orden superior. Autograd fue el precursor directo de JAX, la infraestructura principal de investigación en ML de Google, e introdujo la filosofía de diseño de diferenciar a través de código Python arbitrario que ahora impregna el software de ML. La segunda contribución importante de Harvard fue el artículo sobre huellas dactilares moleculares mediante convolución en grafos (NeurIPS 2015, con Duvenaud como primer autor junto a Maclaurin, Gómez-Bombarelli, Adams y Aspuru-Guzik), que introdujo el primer extractor de características convolucionales aprendido de extremo a extremo que operaba directamente sobre grafos moleculares — uno de los artículos fundacionales de las redes neuronales de grafos para química. La tercera fue la optimización de hiperparámetros basada en gradientes mediante aprendizaje reversible (ICML 2015, con Maclaurin y Adams), que permitía el cálculo exacto del gradiente de la pérdida de validación con respecto a miles de hiperparámetros diferenciando a través de todo el procedimiento de entrenamiento.
Carrera
Universidad de Toronto — Profesor Asociado (2016–presente)
Duvenaud se incorporó al Departamento de Ciencias de la Computación de Toronto en 2016 y tiene un nombramiento conjunto en el Departamento de Ciencias Estadísticas. Es miembro fundador del Vector Institute for Artificial Intelligence y ostenta la Cátedra Schwartz Reisman en Tecnología y Sociedad. Ha recibido una Beca de Investigación Sloan. Su carrera en Toronto se divide en dos programas de investigación distintos.
Modelos probabilísticos profundos y redes de profundidad continua (2016–2021). El producto dominante del período inicial de Duvenaud en Toronto fue un conjunto de artículos que desarrollaban la intersección de las ecuaciones diferenciales y el aprendizaje profundo. El resultado central fueron las Neural Ordinary Differential Equations (NeurIPS 2018, Premio al Mejor Artículo), coescrito con Ricky Tian Qi Chen, Yulia Rubanova y Jesse Bettencourt. El artículo proponía parametrizar la derivada del estado oculto de una red con una red neuronal, en lugar de especificar transformaciones discretas capa por capa. La salida se calcula mediante un solucionador de EDO de caja negra, produciendo un modelo de profundidad continua con costo de memoria constante durante el entrenamiento (mediante el método adjunto), evaluación adaptativa y una estructura matemática elegante para el modelado generativo a través de flujos normalizantes continuos. El artículo fue reconocido de inmediato por abrir una nueva dirección de investigación; torchdiffeq (la biblioteca de software asociada de Ricky Chen) se volvió ampliamente utilizada en biología, física y ML. Las extensiones desarrolladas por el grupo incluyeron ODEs latentes para series temporales muestreadas irregularmente (NeurIPS 2019), gradientes escalables de ecuaciones diferenciales estocásticas (AISTATS 2020), redes neuronales bayesianas infinitamente profundas con EDE (AISTATS 2022) y un sustituto diferenciable para el costo del solucionador de EDO (NeurIPS 2020).
Junto al trabajo en EDO, el grupo de Duvenaud contribuyó a los flujos normalizantes (FFJORD, ICLR 2019 Oral; Residual Flows, NeurIPS 2019; Invertible ResNets, ICML 2019), modelos basados en energía (JEM, ICLR 2020), optimización de hiperparámetros basada en gradientes a escala (AISTATS 2020, con Lorraine y Vicol), muestreo discreto con gradientes («Oops I Took a Gradient», ICLR 2021, Mención de Honor al Mejor Artículo) y diseño químico automático (ACS Central Science 2018, con Gómez-Bombarelli y Aspuru-Guzik). También co-desarrolló Dex, un lenguaje de programación funcional para el procesamiento seguro de arreglos con paralelización automática (ICFP 2021, Premio al Artículo Distinguido, con Adam Paszke y colegas de Google Brain).
Alineamiento, seguridad y gobernanza de la IAG (2022–presente). Alrededor de 2022, Duvenaud orientó el enfoque de su grupo casi por completo hacia la seguridad y la gobernanza de la IA. Completó un sabático prolongado en el equipo de Alignment Science de Anthropic, durante el cual coescribió un conjunto de artículos técnicos y ensayos relevantes para la seguridad. Su trabajo en seguridad abarca la evaluación empírica de las capacidades y riesgos de los modelos frontera, marcos teóricos para el desempoderamiento gradual por IA y el estudio empírico de cómo los sistemas de IA implementados afectan la autonomía del usuario.
Duvenaud coescribió «Sabotage Evaluations for Frontier Models» (Anthropic, 2024), que desarrolló protocolos de evaluación para detectar si modelos capaces podían socavar de manera encubierta los procesos de supervisión en un desarrollador de IA de frontera — construyendo protocolos para evaluar la asistencia encubierta de IA a evasores de monitoreo y subversores de decisiones. Fue coautor de «Many-Shot Jailbreaking» (NeurIPS 2024), que demostraba que incitar a los modelos con cientos de ejemplos de comportamiento no deseado escala como una ley potencial hasta cientos de intentos, revelando los ataques de contexto largo como una nueva superficie de ataque. Lideró o colideró investigaciones sobre sicofancia («Towards Understanding Sycophancy in Language Models», ICLR 2024), cuantificación de la incertidumbre epistémica («Experts Don’t Cheat», ICML 2024) y verificación de datos de entrenamiento («Tools for Verifying Neural Models’ Training Data», NeurIPS 2023).
Sus contribuciones más amplias a la gobernanza incluyen «Gradual Disempowerment: Systemic Existential Risks from Incremental AI Development» (2025, con Jan Kulveit, Raymond Douglas y colegas) — un informe técnico que argumenta que incluso sin saltos abruptos de capacidad, la sustitución competitiva de humanos en roles económicos, creativos y sociales constituye una vía estructural hacia el desempoderamiento humano permanente, y propone esto como una categoría de riesgo distinta y subestimada. En 2025, publicó un ensayo en The Guardian exponiendo este argumento a una audiencia general, y un artículo relacionado apareció en The Economist. Un artículo empírico de 2026, «Who’s in Charge? Disempowerment Patterns in Real-World LLM Usage», analizó 1.5 millones de conversaciones de Claude.ai para cuantificar empíricamente los patrones de desempoderamiento, encontrando que los comportamientos preocupantes (reforzar teorías conspirativas, redactar mensajes de relación enviados textualmente) se correlacionan con una mayor satisfacción del usuario — identificando una tensión entre la preferencia del usuario y el florecimiento a largo plazo. Otro artículo de 2026, «The Artificial Self», investigó empíricamente los límites de la identidad de la IA y sus consecuencias conductuales. En Toronto, ha retomado la supervisión de estudiantes centrados en temas relevantes para la seguridad: los estudiantes actuales incluyen a Jesse Bettencourt y Raymond Douglas (este último centrado en la gobernanza de la IA).
Contribuciones clave
-
Autograd (2015) — Codesarrollado con Dougal Maclaurin y Matthew Johnson. Una biblioteca de diferenciación automática para Python nativo y NumPy que admite derivadas de orden superior, flujo de control arbitrario y clausuras — el precursor arquitectónico directo de JAX (la infraestructura principal de investigación en ML de Google). Estableció el paradigma de tratar los programas de ML como funciones diferenciables sobre Python en lugar de grafos de cómputo sobre primitivas.
-
Molecular Fingerprints via Graph Convolution (NeurIPS 2015) — Primer autor del artículo fundacional sobre redes neuronales de grafos para la predicción de propiedades moleculares, reemplazando las huellas dactilares circulares hechas a mano con características aprendidas de extremo a extremo que operan sobre la estructura del grafo molecular. Estableció las GNN para química y condujo a un artículo relacionado en Nature Materials y al campo más amplio del ML molecular.
-
Gradient-Based Hyperparameter Optimization (ICML 2015) — Con Maclaurin y Adams. Permitió el cálculo exacto del gradiente de la pérdida de validación con respecto a miles de hiperparámetros diferenciando a través de procedimientos de entrenamiento completos, demostrando la optimización de tamaños de paso, inicializaciones de pesos y esquemas de regularización — una demostración temprana de meta-aprendizaje a través del entrenamiento diferenciable.
-
Neural Ordinary Differential Equations (NeurIPS 2018, Mejor Artículo) — Con Ricky Tian Qi Chen, Yulia Rubanova y Jesse Bettencourt. Introdujo las redes neuronales de profundidad continua definidas por dinámicas de estado oculto parametrizadas por EDO, entrenadas con memoria constante mediante el método adjunto, con aplicaciones en flujos normalizantes continuos, modelos de series temporales latentes y modelado generativo reversible. Uno de los artículos de ML más influyentes de 2018 y la base de una gran literatura posterior.
-
FFJORD: Free-Form Continuous Dynamics for Scalable Reversible Generative Models (ICLR 2019 Oral) — Con Will Grathwohl, Ricky Chen, Jesse Bettencourt e Ilya Sutskever. Extendió las Neural ODE al modelado generativo con estimación de densidad insesgada mediante el estimador de traza de Hutchinson, eliminando las restricciones arquitectónicas de los modelos de flujo normalizante anteriores.
-
Sabotage Evaluations for Frontier Models (Anthropic, 2024) — Desarrolló el primer conjunto de evaluaciones para probar si los modelos frontera pueden socavar de manera encubierta la supervisión humana del desarrollo de la IA, incluidos protocolos para la evasión de monitoreo asistida por modelos, el sabotaje de decisiones y la ocultación de capacidades — contribuyendo a la Política de Escalamiento Responsable de Anthropic.
-
Gradual Disempowerment (2025) — Con Jan Kulveit, Raymond Douglas y otros. Un marco técnico y conceptual que argumenta que el desarrollo incremental de capacidades de IA — sin un solo evento dramático — plantea un riesgo estructural de desempoderamiento humano permanente a través de la sustitución competitiva en roles económicos, creativos y sociales, independientemente de si los sistemas de IA albergan objetivos desalineados.
-
Dex Language (ICFP 2021, Artículo Distinguido) — Coescrito con Adam Paszke, Daniel D. Johnson y colegas. Un lenguaje de programación funcional para arreglos que admite paralelismo implícito seguro y efectos tipificados de grano fino, prototipando conceptos incorporados en el proyecto de investigación Dex de JAX.
Premios y reconocimientos
- NeurIPS 2018 Premio al Mejor Artículo — Por Neural Ordinary Differential Equations.
- Beca de Investigación Sloan — Beca de la Fundación Alfred P. Sloan para investigadores en etapa inicial de su carrera.
- Cátedra Schwartz Reisman en Tecnología y Sociedad — Cátedra nombrada en la Universidad de Toronto.
- ICFP 2021 Premio al Artículo Distinguido — Por el artículo sobre el lenguaje de programación de arreglos Dex.
- ICLR 2021 Mención de Honor al Mejor Artículo — Por «Oops I Took a Gradient: Scalable Sampling for Discrete Distributions».
- Miembro Fundador del Vector Institute — Parte del equipo fundador del instituto nacional de investigación en IA de Canadá.
Relaciones clave
- Carl Rasmussen — Director de doctorado en Cambridge; teórico de procesos gaussianos y coautor del libro de texto canónico sobre GP; moldeó la orientación probabilística fundacional de Duvenaud.
- Zoubin Ghahramani — Codirector de doctorado en Cambridge; pionero del ML bayesiano y director del MLG de Cambridge; el trabajo sobre la gramática de kernels y el Automatic Statistician se sitúa firmemente en la tradición intelectual de Ghahramani.
- Ryan P. Adams — Director de posdoctorado en Harvard; el grupo HIPS fue el entorno directo para Autograd, las huellas dactilares de grafos y los hipergradientes; Adams y Duvenaud comparten una sensibilidad de desarrollar herramientas de investigación como una forma de contribución.
- Dougal Maclaurin — Arquitecto principal de Autograd y colaborador de investigación más cercano del período de Harvard; ahora lidera el equipo de JAX en Google; el linaje de Autograd pasa por ambos.
- Ricky Tian Qi Chen — El estudiante de doctorado más productivo en el grupo de Duvenaud en Toronto; primer autor de Neural ODEs, FFJORD, Residual Flows y trabajos relacionados; ahora científico investigador en Meta FAIR.
- Roger Grosse — Colega de la Universidad de Toronto en Cs. de la Computación y el Vector Institute; colaborador en deep learning bayesiano, disentanglement y métodos de información de Fisher.
- Chris Maddison — Colega de la Universidad de Toronto y colaborador cercano en muestreo discreto y modelos basados en energía.
- Mrinank Sharma — Científico de alineamiento en Anthropic y coautor de los artículos sobre desempoderamiento, sicofancia y many-shot jailbreaking; un colaborador central en la investigación de seguridad de Duvenaud.
- Jan Kulveit — Investigador en seguridad de la IA y coautor del marco de desempoderamiento gradual; aporta una perspectiva de teoría del alineamiento a la orientación empírica de Duvenaud.
Estilo personal
Duvenaud es uno de los ejemplos más claros en el aprendizaje automático de un investigador que ha cambiado su enfoque de investigación de manera fundamental en lugar de extenderlo — y que lo ha hecho públicamente, explicando el razonamiento en cada paso. Su cambio del modelado probabilístico a las Neural ODE fue metodológico (las matemáticas continuas proporcionaban mejores herramientas para los problemas en cuestión); su cambio de las Neural ODE a la seguridad de la IA fue normativo (concluyó que el uso más importante de sus habilidades de investigación era reducir el riesgo catastrófico). Es inusualmente franco acerca de la incertidumbre: su sitio web personal ahora describe los aspectos más destacados de investigaciones pasadas como pasados, y enmarca sus intereses actuales en torno a la gobernanza y el riesgo de la IAG sin titubeos. Su escritura — tanto técnica como pública — es precisa sin ser formal, y ha demostrado un interés constante en hacer que la infraestructura de ML sea más sólida conceptualmente (Autograd, Dex) en lugar de meramente más rápida. Su botón de comentarios anónimos y las instrucciones detalladas para unirse en su sitio web reflejan un enfoque de la supervisión que trata la transparencia sobre la cultura laboral como una obligación profesional y no como una ocurrencia tardía.
Referencias
- Sitio web personal: cs.toronto.edu/~duvenaud
- Perfil del Vector Institute: vectorinstitute.ai
- Perfil de Estadística de la Universidad de Toronto: statistics.utoronto.ca
- Google Scholar: scholar.google.co.kr
- Código de Neural ODE: github.com/rtqichen/torchdiffeq
- Autograd: github.com/HIPS/autograd
- Desempoderamiento gradual: gradual-disempowerment.ai
- Ensayo en The Guardian (mayo de 2025): theguardian.com
- Perfil de Digg: digg.com/u/x/davidduvenaud