عالم حاسوب ورياضياتي فرنسي أمريكي وضع الحدود المثلى الدنيا القصوى لمشكلة اللصوص متعددي الأذرع، وأثبت قانون المتانة للشبكات العصبية، وقاد سلسلة نماذج اللغة الصغيرة Phi (فاي) في مايكروسوفت، وهو المؤلف المشارك لورقة “Sparks of AGI” (شرارات الذكاء الاصطناعي العام) حول GPT-4.
نبذة شخصية
| تاريخ الميلاد | 16 أبريل 1985، فرنسا |
| الجنسية | فرنسي أمريكي |
| الجهة الحالية | OpenAI (باحث علمي، 2024–حتى الآن) |
| مجالات البحث | التعلم عبر الإنترنت، اللصوص، التحسين المحدب، أنظمة المهام المترية، نظرية التعلم العميق، نماذج اللغة الكبيرة، نماذج اللغة الصغيرة |
| أطروحة الدكتوراه | دكتوراه في الرياضيات التطبيقية (INRIA Nord Europe / جامعة ليل 1، 2010) |
| الموقع الإلكتروني | sbubeck.com |
| تويتر / X | @SebastienBubeck |
| المدونة | I’m a Bandit |
| جوجل سكولار | Sébastien Bubeck |
لمحة عامة
سيباستيان بوبيك هو عالم رياضيات وكمبيوتر فرنسي أمريكي امتدت مسيرته المهنية عبر التعلم الآلي النظري، والتحليل التنافسي، والذكاء الاصطناعي التجريبي. تدرب في المدرسة العليا للأساتذة في كاشان (ENS Cachan) والمعهد الوطني الفرنسي للبحث في العلوم والتكنولوجيا الرقمية (INRIA)، وبنى النظرية الأساسية لمشكلة اللصوص متعددي الأذرع وتحسين اللصوص المحدب خلال فترة الدكتوراه وأوائل سنوات التدريس في برينستون؛ ثم وسع الأساليب النظرية لتشمل أنظمة المهام المترية ومطاردة الأجسام المحدبة في سلسلة مشهورة من الأوراق مع يين تات لي والمتعاونين في مركز أبحاث مايكروسوفت؛ وأثبت قانون المتانة الذي يربط بين الإفراط في توسيط الشبكات العصبية وانتظامية ليبشيتز؛ وقاد الفريق الذي أنتج سلسلة نماذج Phi (فاي) للغة الصغيرة (بدءًا من نموذج “Textbooks Are All You Need” (الكتب المدرسية هي كل ما تحتاج إليه))؛ وشارك في تأليف ورقة “شرارات الذكاء الاصطناعي العام: تجارب مبكرة مع GPT-4” — وهي وثيقة من 155 صفحة أصبحت واحدة من أكثر وثائق الذكاء الاصطناعي قراءة ومناقشة في عام 2023. في عام 2024 انضم إلى OpenAI. يعكس ملفه على جوجل سكولار أكثر من 25000 اقتباس. يدير مدونة “I’m a Bandit”، وهي واحدة من أقدم المدونات وأكثرها صرامة تقنية في مجتمع التعلم الآلي.
النشأة والتعليم
ولد بوبيك في فرنسا عام 1985. التحق بالمدرسة العليا للأساتذة في كاشان (ENS Cachan، الآن ENS Paris-Saclay) في عام 2005 — وهي واحدة من أعرق المدارس العليا انتقاءً في النظام الفرنسي، مع برنامج رياضيات قوي بشكل خاص — ودرس هناك حتى عام 2008. في صيف عام 2006 شارك في برنامج الأبحاث في المشاريع الصناعية للطلاب (RIPS) في معهد الرياضيات البحتة والتطبيقية (IPAM) في جامعة كاليفورنيا، لوس أنجلوس (UCLA).
بدأ الدكتوراه في INRIA Nord Europe في ليل عام 2007، متخصصًا في الرياضيات التطبيقية تحت إشراف جان إيف أوديبر، وأكملها في عام 2010. كان أوديبر، الباحث الرائد في ENPC وINRIA الذي طور متباينات التركيز الأساسية وطرق الاستكشاف والاستغلال، ذا تأثير فكري تكويني؛ توفي في عام 2011 عن عمر مبكر. عمل بوبيك أيضًا مع ريمي مونوس في INRIA. خلال فترة الدكتوراه عمل كمساعد تدريس في جامعة ليل 1 (2008–2010). تم الاعتراف بأطروحته كأفضل أطروحة دكتوراه فرنسية في الاحتمالات/الإحصاء (جائزة جاك نيفو، 2010)، والوصيفة لأفضل أطروحة دكتوراه فرنسية في علوم الكمبيوتر (جائزة جيل كان، 2010)، والوصيفة لجائزة أطروحة الذكاء الاصطناعي (2011).
المسيرة المهنية
ما بعد الدكتوراه — مركز أبحاث الرياضيات، برشلونة (2010–2011)
بعد الدكتوراه، أمضى بوبيك عامًا واحدًا كباحث ما بعد الدكتوراه في مركز أبحاث الرياضيات في برشلونة، قبل أن ينتقل إلى الولايات المتحدة.
جامعة برينستون — أستاذ مساعد، ORFE (2011–2014)
انضم بوبيك إلى قسم بحوث العمليات والهندسة المالية في برينستون كأستاذ مساعد. خلال هذه الفترة أنتج الدراسة الاستقصائية “تحليل الندم لمشاكل اللصوص متعددي الأذرع العشوائية وغير العشوائية” (2012، مع نيكولو سيزا-بيانكي)، والتي أصبحت النص المرجعي الأساسي لمجتمع تعلم اللصوص — حيث غطت خوارزميات UCB، وأخذ عينات طومسون، واللصوص السياقية، واللصوص الخصومة بإطار نظري موحد. كما كتب ملاحظات المحاضرات المستخدمة على نطاق واسع حول التحسين المحدب والتي أصبحت لاحقًا دراسة “أسس واتجاهات” (Foundations and Trends). أشرف على العديد من الباحثين الجامعيين وحصل على زمالة أبحاث ألفريد بي. سلون في علوم الكمبيوتر في عام 2015. في خريف عام 2013 أمضى فصلًا دراسيًا كعالم زائر في معهد سيمونز لنظرية الحوسبة في جامعة كاليفورنيا، بيركلي.
مركز أبحاث مايكروسوفت — باحث إلى مدير أبحاث رئيسي كبير (2014–2024)
انضم بوبيك إلى مركز أبحاث مايكروسوفت في ريدموند في عام 2014 كباحث في مجموعة النظرية، وتقدم ليصبح باحثًا كبيرًا (2017–2019)، ثم مدير أبحاث رئيسي كبير يقود مجموعة أسس التعلم الآلي (2020–2023)، وأخيرًا نائب رئيس الذكاء الاصطناعي وعالم متميز (2024).
اللصوص والتحسين المحدب (2014–2019). حلت أعماله المبكرة في مايكروسوفت العديد من المشكلات المفتوحة طويلة الأمد في التعلم عبر الإنترنت. قدمت ورقة “الطرق القائمة على النواة لتحسين اللصوص المحدب” (STOC/JACM 2017، مع رونين إلدان وين تات لي) أول خوارزمية زمنية متعددة الحدود تحقق ندمًا مثاليًا أمثل لتحسين اللصوص المحدب — وهي مشكلة ظلت مفتوحة لأكثر من عقد. قاد هذا الخط من العمل إلى جائزة أفضل ورقة في COLT 2016.
k-Server والتحليل التنافسي (2018–2019). بالتعاون مع مايكل بي. كوهين، وين تات لي، جيمس آر. لي، وألكسندر مادري، حل بوبيك سؤالًا مفتوحًا رئيسيًا في التحليل التنافسي من خلال ورقة “K-Server عبر التنظيم الإنتروبي متعدد المقاييس” (STOC 2018)، محققًا أول نسبة تنافسية متعددة اللوغاريتمات لمشكلة k-server على فضاءات مترية عامة عبر تقنية تنظيم إنتروبي جديدة. حصلت الورقة على جائزة أفضل ورقة في NeurIPS 2018. نتيجة مصاحبة، “مطاردة الأجسام المحدبة بشكل تنافسي” (مع يين تات لي، ويوانزي لي، ومارك سيلكي)، حلت مشكلة مطاردة الأجسام المحدبة على النحو الأمثل. حصل هذا الخط من العمل على جائزة أفضل ورقة في STOC 2023، معترفًا بالتأثير الدائم لأوراق 2018–2019.
قانون المتانة (2021). أثبتت ورقة “قانون عالمي للمتانة عبر قياس التساوي” (جائزة أفضل ورقة في NeurIPS 2021، مع مارك سيلكي) نظرية رياضية حادة: الشبكة العصبية التي تستكمل n من نقاط البيانات بثابت ليبشيتز محدود يجب أن تحتوي على الأقل على Ω(n) من المعاملات. النتيجة تُضفي طابعًا رسميًا على سبب قدرة الشبكات العصبية المفرطة في التوسيط على أن تكون ملائمة جيدة وسلسة في نفس الوقت — مما يربط هندسة عدد المعاملات بمتباينات قياس التساوي من الهندسة المحدبة. غطت مجلتا Quanta Magazine وNature النتيجة باعتبارها اختراقًا في الفهم النظري للتعلم العميق. حصلت الورقة على جائزة أفضل ورقة في NeurIPS 2021.
شرارات الذكاء الاصطناعي العام: تجارب مبكرة مع GPT-4 (2023). في أوائل عام 2023، مع حصول مايكروسوفت على وصول مبكر إلى GPT-4 أثناء تطويره، قاد بوبيك فريقًا مكونًا من أربعة عشر مؤلفًا من أبحاث مايكروسوفت في تحقيق تجريبي من 155 صفحة لنسخة مبكرة من النموذج. جادلت المخطوطة الأولية الناتجة، “شرارات الذكاء الاصطناعي العام”، بأن GPT-4 أظهر ذكاءً عامًا أكثر نوعيًا من أنظمة الذكاء الاصطناعي السابقة، مما أظهر كفاءة ملحوظة وغير متوقعة في الرياضيات، والبرمجة، والرؤية، والطب، والقانون، والعديد من المجالات الأخرى دون مطالبات خاصة بالمهمة. أصبحت الورقة — الحذرة في ادعاءاتها ولكنها استفزازية عمدًا في تأطير GPT-4 كنظام “مبكر (وإن كان غير مكتمل)” للذكاء الاصطناعي العام — واحدة من أكثر وثائق الذكاء الاصطناعي التي نوقشت في عام 2023، وغطتها نيويورك تايمز، ووايرد، وThis American Life، والعديد من المنافذ الأخرى، وساهمت في الفهم العام السائد لقدرات نماذج اللغة الكبيرة.
فاي: الكتب المدرسية هي كل ما تحتاج إليه (2023). مباشرة بعد ورقة الشرر، تابع بوبيك والمتعاونون (بشكل أساسي يوانزي لي وآخرون) السؤال: هل يمكن تدريب نموذج أصغر بشكل كبير بشكل مشابه لأداء المهام الرئيسية في الاستدلال، باستخدام بيانات اصطناعية عالية الجودة بدلاً من الحجم؟ قدمت ورقة “الكتب المدرسية هي كل ما تحتاج إليه” نموذج Phi-1 (1.3 مليار معلمة)، تم تدريبه على كتب برمجة اصطناعية تم إنشاؤها بواسطة GPT-4، والذي حقق 50% على HumanEval على الرغم من كونه أصغر بأوامر من الحجم من النماذج المتطورة المعاصرة. تم توسيع هذا النموذج — البيانات الاصطناعية المُنقّاة عالية الجودة “على غرار الكتب المدرسية” والتدريب بتنسيق تعليمي — ليشمل Phi-1.5 (الاستدلال المنطقي السليم) وPhi-2 (المهام المعرفية العامة)، مما أسس عائلة Phi من نماذج اللغة الصغيرة كخط بارز من الذكاء الاصطناعي الفعال. تحدث بوبيك علنًا عن رؤية دمج نماذج اللغة الصغيرة من فئة Phi في الأجهزة اليومية.
OpenAI — باحث علمي (2024–حتى الآن)
في أكتوبر 2024، ذكرت بلومبرج أن بوبيك سيغادر مايكروسوفت للانضمام إلى OpenAI. قام بهذه الخطوة في ذلك الشهر، واستمر في العمل على نماذج اللغة الصغيرة، والأسس النظرية للذكاء الاصطناعي، وفهم نموذج الحدود.
المساهمات الرئيسية
-
نظرية اللصوص الدنيا القصوى (COLT 2009؛ دراسة استقصائية 2012) — ورقة “سياسات الحد الأدنى الأقصى للصوص الخصومة والعشوائية” (مع جان إيف أوديبر) أسست معدلات مثلى دنيا قصوى لمشكلة اللص متعدد الأذرع وقدمت خوارزمية UCB-V. الدراسة الاستقصائية لعام 2012 مع نيكولو سيزا-بيانكي، تحليل الندم لمشاكل اللصوص متعددي الأذرع العشوائية وغير العشوائية، أصبحت المرجع الأساسي لأدبيات اللصوص.
-
التحسين المحدب: الخوارزميات والتعقيد (2015) — دراسة متخصصة في أسس واتجاهات التعلم الآلي تغطي الانحدار المتدرج، وانحدار المرآة، والطرق المتسارعة، وطرق النقاط الداخلية، وتستخدم على نطاق واسع ككتاب دراسي ومرجع في التعلم الآلي النظري.
-
تحسين اللصوص المحدب (STOC 2017) — ورقة “الطرق القائمة على النواة لتحسين اللصوص المحدب”، مع رونين إلدان وين تات لي. أول خوارزمية زمنية متعددة الحدود تحقق الندم الأمثل Õ(√T) لتحسين اللصوص المحدب، لحل مشكلة مفتوحة طويلة الأمد.
-
K-Server عبر التنظيم الإنتروبي متعدد المقاييس (STOC 2018؛ جائزة أفضل ورقة في NeurIPS 2018) — مع مايكل بي. كوهين، وين تات لي، جيمس آر. لي، وألكسندر مادري. حل تخمين k-server الذي دام عقودًا على المقاييس العامة حتى عوامل متعددة اللوغاريتمات، باستخدام نهج تنظيم إنتروبي متعدد المقاييس مبتكر. جائزة أفضل ورقة في STOC 2023 للأثر طويل المدى.
-
قانون المتانة (جائزة أفضل ورقة في NeurIPS 2021) — ورقة “قانون عالمي للمتانة عبر قياس التساوي”، مع مارك سيلكي. أثبتت أن أي شبكة عصبية تستكمل n من نقاط البيانات بثابت ليبشيتز محدود تتطلب على الأقل Ω(n) من المعاملات — صياغة رياضية دقيقة لسبب قدرة الشبكات المفرطة في التوسيط على التعميم بسلاسة.
-
شرارات الذكاء الاصطناعي العام (arXiv 2023) — ورقة “شرارات الذكاء الاصطناعي العام: تجارب مبكرة مع GPT-4”، مع ثلاثة عشر مؤلفًا مشاركًا من أبحاث مايكروسوفت. دراسة تجريبية من 155 صفحة لـ GPT-4 المبكر تجادل بأن النموذج يُظهر ذكاءً عامًا نوعيًا عبر مجالات متنوعة. واحدة من أكثر أوراق الذكاء الاصطناعي قراءة واقتباسًا في عام 2023.
-
فاي / الكتب المدرسية هي كل ما تحتاج إليه (2023) — قاد تطوير سلسلة نماذج اللغة الصغيرة Phi (فاي) (Phi-1، Phi-1.5، Phi-2، Phi-3) بناءً على فكرة أن البيانات الاصطناعية عالية الجودة بتنسيق الكتب المدرسية تمكن النماذج الأصغر بشكل كبير من مساواة أو تجاوز النماذج الأكبر بكثير على معايير الاستدلال الرئيسية. يحقق نموذج Phi-3-mini أداءً مشابهًا لفئة GPT-3.5 بحجم 3.8 مليار معلمة.
الجوائز والتكريمات
- جائزة أفضل ورقة في STOC 2023 — لخط العمل حول k-server/مطاردة الأجسام المحدبة (أوراق من 2018–2019).
- جائزة أفضل ورقة في NeurIPS 2021 — لورقة قانون المتانة.
- جائزة أفضل ورقة في NeurIPS 2018 — لـ k-server عبر التنظيم الإنتروبي متعدد المقاييس.
- جائزة أفضل ورقة في COLT 2016 — لتحسين اللصوص المحدب الأمثل.
- زمالة أبحاث ألفريد بي. سلون في علوم الكمبيوتر (2015) — مُنحت من قبل مؤسسة سلون للباحثين في بداية مسيرتهم المهنية ذوي الإمكانات الاستثنائية.
- جوائز أفضل ورقة طلابية — COLT 2009 (اللصوص الدنيا القصوى)؛ ALT 2018؛ ALT 2023.
- جائزة جاك نيفو (2010) — أفضل أطروحة دكتوراه فرنسية في الاحتمالات/الإحصاء.
- جائزة جيل كان (2010) — الجائزة الثانية، أفضل أطروحة دكتوراه فرنسية في علوم الكمبيوتر.
- جائزة أطروحة الذكاء الاصطناعي (2011) — الجائزة الثانية، أفضل أطروحة دكتوراه فرنسية في الذكاء الاصطناعي.
العلاقات الرئيسية
- يين تات لي — أكثر تعاون بحثي مستمر في مسيرة بوبيك المهنية، بدأ كمتدرب في MSR (2015–2016) واستمر عبر تحسين اللصوص المحدب، وk-server، ومطاردة الأجسام المحدبة، والأعمال ذات الصلة. لي هو الآن باحث رئيسي في MSR.
- رونين إلدان — متعاون طويل الأمد عبر تحسين اللصوص، وقانون المتانة، وورقة شرارات الذكاء الاصطناعي العام؛ عالم احتمالات وكمبيوتر في معهد وايزمان ولاحقًا في MSR.
- يوانزي لي — متدرب تحول إلى متعاون عمل على مطاردة الأجسام المحدبة ثم شارك في قيادة مبادرة فاي SLM؛ باحث رئيسي في MSR وأستاذ مساعد سابق في CMU.
- مارك سيلكي — متدرب شارك في تأليف ورقة قانون المتانة ونتائج مطاردة الأجسام المحدبة؛ الآن في ستانفورد مع أندريا مونتاناري.
- مايكل بي. كوهين — متدرب موهوب بشكل استثنائي شارك في تأليف ورقة k-server والعديد من الأعمال النظرية الأخرى؛ توفي في عام 2017 بسبب مرض السكري من النوع الأول غير المشخص عن عمر 20 عامًا. تحدث وكتب بوبيك ببلاغة عن وفاة كوهين.
- جان إيف أوديبر — مشرف الدكتوراه؛ باحث مؤثر في متباينات التركيز وتعلم اللصوص توفي prematurely في عام 2011. شكل نهجه البحثي — الدقة الرياضية، والنظرية الاحتمالية — التوجه الأساسي لوبيك.
- نيكولو سيزا-بيانكي — مشارك في تأليف الدراسة الاستقصائية الأساسية للصوص؛ الشخصية الرائدة في التعلم عبر الإنترنت والتي عرّف معها بوبيك المرجع القياسي للمجال.
- ألكسندر مادري — متعاون في k-server؛ أستاذ في معهد ماساتشوستس للتكنولوجيا (MIT) معروف بأبحاث المتانة الخصومة.
الأسلوب الشخصي
يتسم بحث بوبيك بمسار غير عادي: من نظرية الاحتمالات الأساسية والتحليل التنافسي في أحد الطرفين، عبر الهندسة المحدبة، إلى التحقيق التجريبي لأكثر أنظمة الذكاء الاصطناعي تقدمًا في الطرف الآخر. الخيط الفكري هو التركيز المستمر على ما يمكن إثباته — سواء كان ذلك يعني حدود ندم ضيقة لخوارزميات اللصوص، أو حدودًا دنيا حادة لعدد المعاملات لشبكات ليبشيتز، أو توصيفات صارمة (وإن كانت غير رسمية) لقدرات GPT-4. مدونته، “I’m a Bandit”، التي بدأت في برينستون واستمرت لأكثر من عقد، يُشار إليها باستمرار كواحدة من المدونات الشخصية القليلة الصارمة تقنيًا في التعلم الآلي النظري، والتي تغطي المشكلات المفتوحة وملاحظات المحاضرات والتعليقات الأصلية بأسلوب موثوق ويمكن الوصول إليه في نفس الوقت. لقد كان مرشدًا كريمًا: العديد من المتدربين السابقين (يين تات لي، ويوانزي لي، ومارك سيلكي) أصبحوا باحثين رائدين بأنفسهم، وكتب علنًا عن الفقدان المأساوي لمايكل بي. كوهين في عام 2017 بطريقة تكشف عن استثماره في الأشخاص وكذلك الرياضيات.
المراجع
- الموقع الشخصي: sbubeck.com
- السيرة الذاتية: sbubeck.com/bio.html
- الجوائز: sbubeck.com/awards.html
- جوجل سكولار: scholar.google.com
- ويكيبيديا: Sébastien Bubeck
- مدونة “I’m a Bandit”: blogs.princeton.edu/imabandit
- ورقة شرارات الذكاء الاصطناعي العام: arxiv.org/abs/2303.12712
- بلومبرج (الانضمام إلى OpenAI، أكتوبر 2024): bloomberg.com
- ملف ديغ: digg.com/u/x/sebastienbubeck