Ilya Sutskever

Chercheur israélo-canadien en deep learning ; co-inventeur d’AlexNet, co-fondateur et longtemps Chief Scientist d’OpenAI, fondateur et PDG de Safe Superintelligence Inc.


Informations de base / Profil

Champ Détails
Nom complet Ilya Efimovich Sutskever
Naissance 1986, Gorki (aujourd’hui Nijni Novgorod), RSFS de Russie, Union soviétique
Nationalité Israélo-canadienne
Institution actuelle Safe Superintelligence Inc. (SSI)
Titre actuel PDG
Domaines de recherche Deep learning, réseaux de neurones récurrents, modélisation de séquences, alignment de l’IA, sécurité de la superintelligence
Directeur de thèse Geoffrey Hinton
Thèse de doctorat Training Recurrent Neural Networks (Université de Toronto, 2013)
Site web personnel cs.toronto.edu/~ilya
X / Twitter @ilyasut
Google Scholar scholar.google.com/citations?user=x04W_mMAAAAJ

Présentation générale

Ilya Sutskever est un informaticien israélo-canadien largement considéré comme l’une des figures les plus marquantes de l’ère du deep learning. Élève de Geoffrey Hinton à l’Université de Toronto, il a co-inventé AlexNet – le réseau convolutif dont la victoire à ImageNet en 2012 est souvent citée comme le point d’inflexion de l’IA moderne – puis a co-écrit le framework séquence-à-séquence qui sous-tend une grande partie du traitement moderne du langage naturel. En tant que co-fondateur et Chief Scientist d’OpenAI de 2015 à 2024, il a façonné le programme de recherche qui a produit GPT, ChatGPT, DALL-E, CLIP et le modèle de raisonnement o1, et est crédité d’avoir établi l’éthique du passage à l’échelle de l’organisation. En juin 2024, il a fondé Safe Superintelligence Inc. (SSI), une entreprise dont l’objectif unique et explicite est de construire une superintelligence sûre, et en est devenu le PDG en juillet 2025 après le départ du co-fondateur Daniel Gross pour Meta. Il est l’un des informaticiens les plus cités de l’histoire et a remporté le NeurIPS Test of Time Award trois années consécutives (2022–2024).


Jeunesse et éducation

Enfance : Russie, Israël, Canada

Sutskever est né en 1986 dans une famille juive à Gorki (aujourd’hui Nijni Novgorod), en RSFS de Russie, en Union soviétique. À l’âge de cinq ans, sa famille a fait son aliyah et s’est installée à Jérusalem, où il a été scolarisé et a commencé ses études à l’Université ouverte d’Israël. Vers l’âge de seize ans, la famille a de nouveau déménagé, cette fois au Canada. Il a fréquenté un lycée canadien pendant environ un mois avant d’être admis directement à l’Université de Toronto en tant qu’étudiant de troisième année de licence – une admission qui reflète le niveau avancé qu’il avait déjà atteint.

Université de Toronto — BSc, MSc, PhD (2002–2013)

Sutskever a obtenu trois diplômes à l’Université de Toronto sous l’influence intellectuelle de Geoffrey Hinton, l’un des principaux architectes du deep learning moderne. Il a obtenu un baccalauréat ès sciences en mathématiques en 2005, une maîtrise ès sciences en informatique en 2007 (mémoire : Nonlinear Multilayered Sequence Models) et un doctorat en informatique en 2013 (thèse : Training Recurrent Neural Networks). Au cours de cette décennie, il a contribué au groupe de recherche de Hinton sur les machines de Boltzmann restreintes, les réseaux de croyances profondes et les fondements précoces de l’entraînement des réseaux de neurones à grande échelle. En 2012, pendant la phase finale de son doctorat, il a co-construit AlexNet avec Hinton et Alex Krizhevsky, remportant le concours ImageNet Large Scale Visual Recognition avec une marge qui a stupéfié la communauté de la vision par ordinateur.

Parenthèse postdoctorale et DNNResearch (2012–2013)

Après le résultat d’AlexNet, Sutskever a passé environ deux mois comme chercheur postdoctoral avec Andrew Ng à Stanford avant de retourner à Toronto pour rejoindre DNNResearch, une spin-off du groupe de Hinton. En mars 2013, Google a acquis DNNResearch et a embauché Sutskever, Hinton et Krizhevsky – une acquisition largement décrite comme le premier mouvement de la guerre des talents en deep learning.


Carrière

Google Brain — Chercheur scientifique (2013–2015)

Chez Google Brain, Sutskever a travaillé avec Oriol Vinyals et Quoc V. Le pour développer le framework d’apprentissage séquence-à-séquence (seq2seq), présenté à NeurIPS 2014. L’architecture – entraînant un réseau de neurones récurrent pour encoder une séquence d’entrée de longueur variable et un second pour la décoder en une séquence de sortie – a fourni la base de la traduction automatique neuronale, des systèmes de dialogue et plus tard de la modélisation du langage à grande échelle. Il a également contribué à TensorFlow et est apparu comme co-auteur sur le papier AlphaGo. Il a quitté Google à la fin de 2015 pour co-fonder OpenAI.

OpenAI — Co-fondateur et Chief Scientist (2015–2024)

Sutskever faisait partie du groupe fondateur qui a lancé OpenAI en décembre 2015, aux côtés de Sam Altman, Greg Brockman, Elon Musk et d’autres. En tant que Chief Scientist, il a supervisé directement la direction de la recherche d’OpenAI pendant près de neuf ans, un mandat qui a couvert la période la plus conséquente du domaine. Il a établi l’éthique du passage à l’échelle de l’organisation – la conviction que l’augmentation de la taille des modèles et du volume de données produirait des capacités améliorées de manière proportionnelle – qui a guidé la série GPT du GPT-1 au GPT-4. Il a été une figure clé dans la recherche qui a mené à ChatGPT et a ensuite dirigé l’équipe qui a produit le modèle de raisonnement o1, qui utilisait l’apprentissage par renforcement pour susciter une résolution de problèmes par chaîne de pensée au moment du test. En juillet 2023, il a co-annoncé le projet Superalignment, s’engageant à résoudre l’alignement des systèmes superintelligents en quatre ans et promettant 20 % de la puissance de calcul d’OpenAI à cet effort – un engagement qui, selon des reportages ultérieurs, n’a jamais été pleinement tenu.

En novembre 2023, Sutskever a été l’un des quatre membres du conseil d’administration à voter pour destituer Sam Altman de son poste de PDG, invoquant des préoccupations concernant la franchise et la gouvernance. Il a ensuite rédigé un mémo de 52 pages au conseil d’administration s’appuyant sur les informations fournies par Mira Murati, détaillant ses objections à la conduite d’Altman. En quelques jours, il a publiquement exprimé ses regrets d’avoir participé au licenciement ; Altman a été réintégré après une semaine, et Sutskever a quitté le conseil d’administration. Il a été largement absent des opérations d’OpenAI dans les mois qui ont suivi. En mai 2024, il a annoncé son départ, décrivant son prochain projet comme «très personnellement significatif». Sa démission est survenue le même jour que celle de Jan Leike, co-responsable de l’équipe Superalignment, qui a cité une érosion de la culture de la sécurité chez OpenAI.

Safe Superintelligence Inc. — Co-fondateur et PDG (2024–présent)

En juin 2024, Sutskever a annoncé Safe Superintelligence Inc. (SSI), co-fondée avec Daniel Gross et Daniel Levy, avec des bureaux à Palo Alto et Tel Aviv. La mission déclarée de l’entreprise est étroite et explicite : son premier et unique produit sera une superintelligence sûre ; elle ne construira aucun autre produit et ne poursuivra pas de revenus dans l’intervalle. En septembre 2024, SSI a levé 1 milliard de dollars auprès d’Andreessen Horowitz, Sequoia Capital, DST Global et SV Angel. En mars 2025, une nouvelle levée de fonds de 2 milliards de dollars avait porté la valorisation déclarée à 32 milliards de dollars. En juin 2025, Meta a tenté d’acquérir SSI directement ; l’entreprise a refusé. Peu de temps après, le co-fondateur et PDG Daniel Gross est parti pour Meta, et Sutskever a assumé le rôle de PDG. L’entreprise n’a publié aucune recherche publique à la mi-2026 et fonctionne avec un haut degré de secret.


Contributions clés

  • AlexNet (NeurIPS 2012, avec Alex Krizhevsky et Geoffrey Hinton) — Un réseau de neurones convolutif profond qui a remporté le défi ImageNet 2012 avec un taux d’erreur dans le top 5 de 15,3 %, réduisant de près de moitié le meilleur résultat de l’année précédente ; largement considéré comme l’article qui a catalysé l’ère moderne du deep learning. Le code source a été conservé par le Computer History Museum.
  • Dropout (JMLR 2014, avec Hinton, Krizhevsky, Srivastava et Salakhutdinov) — A co-écrit l’article formalisant le dropout comme méthode de régularisation pour les réseaux de neurones ; est devenu l’une des techniques les plus universellement appliquées en deep learning.
  • Séquence-à-Séquence Learning with Neural Networks (NeurIPS 2014, avec Oriol Vinyals et Quoc V. Le) — A introduit l’architecture récurrente encodeur-décodeur qui a formé la base de la traduction automatique neuronale et a ensuite façonné la modélisation du langage de l’ère du transformer. NeurIPS Test of Time Award 2022.
  • Série GPT et ChatGPT — En tant que Chief Scientist d’OpenAI, a fourni le leadership de recherche sur la lignée GPT-1 à GPT-4 et le déploiement de ChatGPT ; crédité d’avoir institutionnalisé l’hypothèse du passage à l’échelle comme engagement central de recherche de l’organisation.
  • DALL-E et CLIP — Co-auteur sur les articles fondateurs vision-langage qui ont établi des approches contrastives et génératives pour l’IA multimodale ; NeurIPS Test of Time Award 2023 (pour des travaux connexes) et 2024.
  • Modèle de raisonnement o1 — A dirigé l’effort de recherche d’OpenAI produisant le modèle o1, qui applique l’apprentissage par renforcement pour susciter un raisonnement par chaîne de pensée au moment de l’inférence, représentant un changement de paradigme distinct par rapport à la prédiction pure du prochain jeton.
  • Superalignment — A co-annoncé et aidé à conceptualiser le programme d’OpenAI pour aligner les systèmes superintelligents, apportant un focus institutionnel au problème technique de l’alignement à un moment de passage à l’échelle rapide des capacités.
  • Safe Superintelligence Inc. — A fondé SSI en tant que laboratoire d’IA dédié à la sécurité sans obligations de produit commercial, un pari structurel selon lequel séparer la recherche sur les capacités de la pression des revenus est une condition préalable au développement sûr.

Prix et reconnaissance

  • MIT Technology Review Innovators Under 35 (2015) — Reconnu pour ses contributions au deep learning et à la recherche sur les réseaux de neurones.
  • Fellow de la Royal Society (FRS) (2022) — Élu à l’académie nationale des sciences du Royaume-Uni, l’une des bourses scientifiques les plus anciennes et les plus prestigieuses.
  • TIME100 AI (2023, 2024) — Nommé sur la liste annuelle du magazine Time des personnes les plus influentes dans l’intelligence artificielle deux années consécutives.
  • NeurIPS Test of Time Award (2022, 2023, 2024) — Remporté trois années consécutives, récompensant des articles ayant eu un impact durable sur le domaine pendant au moins une décennie ; le seul chercheur à avoir obtenu cette distinction trois fois de suite.
  • Doctorat honorifique, Université de Toronto (2025) — Décerné par son alma mater pour son leadership en IA et dans le développement responsable de l’IA.
  • National Academy of Sciences Award for the Industrial Application of Science (2026) — La première fois que ce prix a été décerné dans le domaine de l’intelligence artificielle.

Relations clés

  • Geoffrey Hinton — Directeur de thèse et l’influence intellectuelle la plus directe sur la formation de recherche de Sutskever ; co-inventeur d’AlexNet ; après avoir remporté le prix Nobel de physique 2024, Hinton a déclaré publiquement qu’il était fier que Sutskever ait participé au vote pour destituer Sam Altman, citant des préoccupations communes concernant la sécurité de l’IA.
  • Alex Krizhevsky — Camarade de laboratoire à l’Université de Toronto et co-inventeur d’AlexNet ; la collaboration à trois entre Sutskever, Krizhevsky et Hinton a produit l’article qui a commencé l’ère moderne du deep learning.
  • Sam Altman — Co-fondateur et PDG d’OpenAI ; proche collaborateur de Sutskever pendant près de neuf ans avant la crise du conseil d’administration de novembre 2023, au cours de laquelle Sutskever a voté pour la destitution d’Altman et a ensuite exprimé publiquement ses regrets.
  • Oriol Vinyals — Co-auteur sur l’article séquence-à-séquence chez Google Brain ; a ensuite dirigé AlphaStar et d’autres grands projets de DeepMind.
  • Quoc V. Le — Co-auteur sur l’article seq2seq ; chercheur de longue date chez Google Brain et collaborateur sur les premiers travaux de deep learning à grande échelle.
  • Jan Leike — Co-responsable du projet Superalignment d’OpenAI ; son départ simultané avec Sutskever en mai 2024 et sa déclaration publique citant l’érosion de la culture de la sécurité ont présenté les départs comme un signal conjoint sur la direction d’OpenAI.
  • Daniel Gross — Co-fondateur et PDG original de SSI ; parti pour Meta en juin 2025 après la tentative d’acquisition infructueuse de Meta, laissant Sutskever comme seul PDG.
  • Daniel Levy — Co-fondateur de SSI ; chercheur et ancien collègue d’OpenAI qui a rejoint Sutskever pour constituer l’équipe technique.

Style personnel

Sutskever est connu pour combiner une profonde intuition mathématique avec un engagement presque mystique envers la question de la sécurité à long terme – une combinaison qui le rend inhabituel parmi les chercheurs également à l’aise dans l’ingénierie basée sur des benchmarks que dans le raisonnement sur le risque existentiel. Ses remarques publiques sont notablement rares et soigneusement nuancées ; il accorde rarement des interviews, et quand il le fait, ses déclarations tendent vers le philosophique plutôt que l’opérationnel, comme dans son observation de 2022 selon laquelle les grands réseaux de neurones pourraient être «légèrement conscients», qu’il a offerte non pas comme une affirmation mais comme une possibilité méritant d’être prise au sérieux. Au sein des communautés de recherche, il est décrit comme ayant un prior inhabituellement fort sur ce qui va passer à l’échelle – un calibrage affiné par l’expérience d’AlexNet et ensuite par la série GPT – ce qui a fait de lui une voix interne faisant autorité sur les directions de recherche qu’OpenAI devrait poursuivre. La structure fondatrice de SSI, sans produits, sans revenus et sans communications publiques sur les progrès de la recherche, est en soi une expression de son style : maximaliste dans l’ambition, minimaliste dans la présence publique.


Références