Investigador canadiense de deep learning y director científico de Mila – Instituto Quebequés de IA, conocido por sus contribuciones fundacionales a los modelos autorregresivos neuronales, los autoencoders denoising y el zero-shot learning.
Perfil
| Nacimiento | 1981, Canadá |
| Nacionalidad | Canadiense |
| Institución actual | Mila – Instituto Quebequés de IA; Université de Montréal (Adjunto); McGill University (Adjunto) |
| Áreas de investigación | Deep Learning, Modelos Generativos, Aprendizaje de Representaciones, Zero-Shot Learning |
| Doctorado | Yoshua Bengio |
| Tesis doctoral | Études de techniques d’apprentissage non-supervisé pour l’amélioration de l’entraînement supervisé de modèles connexionnistes (2009) |
| Sitio web personal | cs.toronto.edu/~larocheh |
| X / Twitter | @hugo_larochelle |
| GitHub | larocheh |
Resumen
Hugo Larochelle es un informático canadiense cuyo trabajo doctoral y posdoctoral lo colocó en el corazón del ecosistema de deep learning de Montreal durante sus años de formación. Su investigación produjo varias técnicas ahora integradas en los sistemas modernos de IA, incluidos los autoencoders denoising, los modelos de distribución autorregresivos neuronales y una formalización temprana del zero-shot learning. Tras una década que abarcó el mundo académico, la adquisición de una startup y el liderazgo del laboratorio de IA de Google en Montreal, fue nombrado director científico de Mila, el Instituto Quebequés de IA, en septiembre de 2025, sucediendo a Laurent Charlin en el cargo — asumiendo efectivamente el puesto institucional asociado durante mucho tiempo con su propio supervisor de doctorado, Yoshua Bengio. Es profesor adjunto tanto en la Université de Montréal como en McGill University, y es titular de una Cátedra CIFAR de IA en Canadá.
Primeros años y educación
Hugo Larochelle nació en 1981 en Canadá y cursó toda su educación universitaria en la Université de Montréal. Obtuvo una Licenciatura en Matemáticas e Informática en 2004, y luego permaneció en la misma institución para sus estudios de doctorado.
Su doctorado en Informática se completó en 2009 bajo la supervisión de Yoshua Bengio. La tesis, titulada Études de techniques d’apprentissage non-supervisé pour l’amélioration de l’entraînement supervisé de modèles connexionnistes (Estudios de técnicas de aprendizaje no supervisado para mejorar el entrenamiento supervisado de modelos conexionistas), exploró estrategias de preentrenamiento para redes profundas en un momento en que el campo aún no había obtenido aceptación generalizada. Como Larochelle recordó más tarde, el trabajo temprano que involucraba redes neuronales artificiales se encontró con un considerable escepticismo: el primer artículo en el que trabajó fue recibido con desinterés porque involucraba redes neuronales artificiales, un concepto que aún no había ganado mucho impulso.
De 2009 a 2011, completó una investigación posdoctoral en la Universidad de Toronto bajo la supervisión de Geoffrey Hinton — la segunda de las dos figuras ahora ampliamente llamadas “Padrinos de la IA” que moldearon su carrera temprana.
Carrera
Université de Sherbrooke (2011–2016)
Larochelle se unió al Département d’informatique de la Université de Sherbrooke como profesor asistente en 2011. Durante este período continuó publicando prolíficamente sobre modelos generativos y aprendizaje de representaciones, mientras impartía cursos que luego se convertirían en la base de su ampliamente difundida serie de conferencias en línea. Fue también durante este tiempo que comenzó el trabajo aplicado que conduciría a una startup.
Whetlab / Twitter (2014–2016)
Mientras estaba en Sherbrooke, Larochelle cofundó Whetlab junto a Jasper Snoek, Kevin Swersky, Ryan P. Adams y Alex Wiltschko. La empresa se centró en técnicas prácticas de optimización bayesiana para automatizar el ajuste de hiperparámetros de machine learning. Whetlab fue adquirida por Twitter en junio de 2015. Tras la adquisición, Larochelle se mudó a Twitter como científico investigador en el grupo Twitter Cortex.
Google Brain Montreal (2016–2023)
A finales de 2016, Larochelle dejó Twitter para establecer y liderar un nuevo grupo de investigación de Google Brain en Montreal — el primer laboratorio de investigación de IA dedicado de Google en Canadá. Fue reclutado para liderar el laboratorio de investigación de IA de Google en Montreal, que ahora está integrado en Google DeepMind. Bajo su dirección, el laboratorio se convirtió en uno de los puestos de investigación más productivos de Google, trabajando en áreas que van desde el aprendizaje por refuerzo y el modelado generativo hasta aplicaciones en ciencias ambientales y generación de código.
Google DeepMind Montreal (2023–2025)
En abril de 2023, Google Brain se fusionó con DeepMind para formar Google DeepMind. Larochelle trabajó como científico principal dentro de la organización unificada de Google DeepMind en Montreal hasta abril de 2025.
Mila – Instituto Quebequés de IA (2025–presente)
En septiembre de 2025, Mila anunció el nombramiento de Hugo Larochelle para el cargo de director científico. Asumió oficialmente sus funciones el 2 de septiembre, sucediendo a Laurent Charlin, quien había estado actuando en esa capacidad desde que Yoshua Bengio hizo la transición al cargo de fundador y asesor científico de Mila. En esta capacidad, lidera un instituto con una comunidad de más de 1.500 investigadores y 150 socios industriales. Su visión declarada enfatiza la investigación interdisciplinaria que él llama “IA y x”, conectando el machine learning con campos como la ecología, la salud y las ciencias ambientales.
Contribuciones clave
-
Autoencoders Denoising (DAE) — Coautor del artículo fundacional de ICML 2008 y su extensión en JMLR 2010 con Pascal Vincent, Yoshua Bengio y otros. El trabajo estableció la reconstrucción de entradas corruptas como un paradigma escalable para aprender representaciones significativas a partir de grandes cantidades de datos no etiquetados, y sigue siendo una referencia fundamental en el aprendizaje autosupervisado.
-
Zero-Data Learning of New Tasks — Un artículo de AAAI 2008 con Dumitru Erhan y Yoshua Bengio que formalizó el concepto de generalizar a categorías para las que no existen ejemplos de entrenamiento etiquetados. Este trabajo introdujo el ahora estándar concepto de zero-shot learning que subyace a una gran parte de la investigación moderna sobre transfer learning y few-shot learning.
-
Neural Autoregressive Distribution Estimator (NADE) — Presentado en AISTATS 2011 con Iain Murray, ganando un Premio al Artículo Notable. NADE ofreció un enfoque manejable y escalable para modelar distribuciones multivariadas que ayudó a establecer el modelado autorregresivo neuronal como un paradigma práctico. A través de modelos como NADE y MADE, Larochelle ayudó a popularizar el paradigma del modelado autorregresivo neuronal ahora omnipresente en la IA generativa.
-
Greedy Layer-Wise Training of Deep Networks — Coautor con Yoshua Bengio y colegas en NIPS 2007, uno de los artículos seminales que demostró que las redes profundas podían entrenarse eficazmente mediante el preentrenamiento no supervisado capa por capa.
-
Exploring Strategies for Training Deep Neural Networks — Un estudio exhaustivo de JMLR 2009 que proporciona orientación empírica sistemática sobre el entrenamiento de arquitecturas profundas, ampliamente citado en la década posterior de desarrollo del deep learning.
-
Transactions on Machine Learning Research (TMLR) — Larochelle cofundó TMLR junto con Raia Hadsell y Kyunghyun Cho; la revista se lanzó en 2022 bajo el paraguas del Journal of Machine Learning Research. Se desempeñó como editor en jefe fundador hasta finales de 2025, dando forma a un modelo de publicación diseñado para proporcionar una revisión por pares más rápida y abierta para la comunidad de ML.
-
Curso en Línea de Redes Neuronales — Creó una serie completa de videoconferencias sobre redes neuronales y deep learning basada en cursos impartidos en la Université de Sherbrooke, disponible gratuitamente en YouTube y ampliamente utilizada por estudiantes y educadores de todo el mundo.
-
Conferencia TechAide — Fundó el evento anual TechAide, movilizando a la comunidad tecnológica de Montreal para recaudar fondos para Centraide en apoyo a su misión de combatir la pobreza y la exclusión social.
Premios y reconocimientos
- Premio al Artículo Notable de AISTATS (2011) — Otorgado a “The Neural Autoregressive Distribution Estimator” coautorado con Iain Murray.
- Cátedra CIFAR de IA en Canadá — Una cátedra de investigación competitiva que reconoce a los principales investigadores de IA en Canadá, en conjunto con el programa Aprendizaje en Máquinas y Cerebros de CIFAR.
- Linaje del Premio Turing — Entrenado directamente bajo Yoshua Bengio (Premio Turing 2018) y Geoffrey Hinton (Premio Turing 2018), un linaje académico inusual que sitúa a Larochelle en el centro de la escuela de deep learning de Montreal.
Relaciones clave
- Yoshua Bengio — Supervisor de doctorado en la Université de Montréal; laureado con el Premio Turing y fundador de Mila, cuyo cargo de director científico ahora ocupa Larochelle.
- Geoffrey Hinton — Supervisor posdoctoral en la Universidad de Toronto; laureado con el Premio Turing y una de las figuras principales de la revolución del deep learning.
- Pascal Vincent — Colaborador temprano frecuente; coautor de los artículos sobre autoencoders denoising que se convirtieron en hitos del aprendizaje autosupervisado.
- Iain Murray — Coautor del artículo NADE (Premio al Artículo Notable de AISTATS 2011); colaborador de larga data en modelado generativo.
- Jasper Snoek y Kevin Swersky — Cofundadores de Whetlab; colaboradores en la investigación de optimización bayesiana de hiperparámetros que sustentó la startup.
- Raia Hadsell y Kyunghyun Cho — Cofundadores de TMLR; los tres colaboraron para diseñar y lanzar la revista como un nuevo modelo de revisión por pares para la investigación en ML.
- Aaron Courville — Colega de Mila y colaborador de larga data en investigación de deep learning y aprendizaje por refuerzo.
- Laurent Charlin — Predecesor inmediato como director científico interino de Mila; profesor asociado en HEC Montréal.
Estilo personal
El estilo de investigación de Larochelle se caracteriza por un riguroso empirismo y una preferencia por modelos probabilísticos manejables y basados en principios sobre enfoques puramente impulsados por la ingeniería — una sensibilidad que refleja su formación en la escuela de Bengio. En el discurso público es mesurado y colegiado, rara vez polémico, y tiende a enmarcar la importancia de la investigación académica en IA en términos de su capacidad para perseguir preguntas que los laboratorios industriales podrían despriorizar. Desde que asumió el cargo de director científico en Mila, ha articulado una visión centrada en la aplicación interdisciplinaria — “IA y x” — y se ha manifestado abiertamente sobre la relevancia continua de la investigación abierta y arraigada en la universidad en una era de grandes laboratorios corporativos. Como filántropo, él y su esposa han realizado compromisos financieros personales sustanciales para financiar becas de posgrado en IA aplicada a problemas ambientales, reflejando una alineación consistente entre sus valores declarados y sus elecciones profesionales.
Referencias
- Directorio de Mila: mila.quebec/en/directory/hugo-larochelle
- Sitio académico personal: cs.toronto.edu/~larocheh
- Google Scholar: scholar.google.ca — Hugo Larochelle
- Perfil de Google Research: research.google.com/pubs/105144.html
- Biografía de CIFAR: cifar.ca/bios/hugo-larochelle
- Perfil de X: digg.com/u/x/hugo_larochelle
- Comunicado de prensa de Mila — nombramiento como director científico (2 de septiembre de 2025): mila.quebec/en/news/hugo-larochelle-becomes-the-new-scientific-director-of-mila
- Wikitia: wikitia.com/wiki/Hugo_Larochelle
- Perfil de The Globe and Mail (septiembre de 2025): «Para el nuevo director de Mila, el descubrimiento científico es la misión principal»
- Entrevista de The Logic (noviembre de 2025): «Hugo Larochelle, de Mila, dice que la academia puede hacer lo que la industria no hará para avanzar en la IA»