أستاذ في قسم الهندسة الكهربائية وعلوم الحاسوب بجامعة كاليفورنيا، بركلي، والمؤسس المشارك لـ Covariant وGradescope، والحائز على جائزة ACM في الحوسبة لعام 2021، وأحد أكثر المشرفين على الدكتوراه تأثيرًا في الذكاء الاصطناعي الحديث — الذين شارك طلابه في تأسيس OpenAI، وPhysical Intelligence، وPerplexity، وعشرات الشركات الأخرى.
لمحة شخصية
| المجال | التفاصيل |
|---|---|
| تاريخ الميلاد | 1977، أنتويرب، بلجيكا |
| الجنسية | بلجيكي-أمريكي |
| المناصب الحالية | أستاذ، قسم الهندسة الكهربائية وعلوم الحاسوب، جامعة كاليفورنيا، بركلي؛ باحث في أمازون (الذكاء العام الاصطناعي/نماذج اللغة الكبيرة)؛ مدير مشارك، BAIR |
| مجالات البحث | تعلم الروبوتات، التعلم المعزز العميق، التعلم المهني، تعلم المحاكاة، نماذج الأساسيات للروبوتات |
| مشرف الدكتوراه | أندرو نغ (جامعة ستانفورد) |
| أطروحة الدكتوراه | التعلم المهني والتعلم المعزز مع تطبيقات في التحكم الروبوتي (جامعة ستانفورد، 2008) |
| الموقع الأكاديمي | people.eecs.berkeley.edu/~pabbeel |
| تويتر | @pabbeel |
| GitHub | @pabbeel |
| جوجل سكولار | scholar.google.com |
نظرة عامة
بيتر أبيل هو أستاذ بلجيكي-أمريكي في الهندسة الكهربائية وعلوم الحاسوب بجامعة كاليفورنيا، بركلي، والمدير المشارك لمختبر أبحاث الذكاء الاصطناعي في بركلي (BAIR)، وأحد أكثر الشخصيات تأثيرًا في تعلم الروبوتات على مدى العقدين الماضيين. حصل على جائزة ACM في الحوسبة لعام 2021 — وهي واحدة من أعرق الجوائز في المجال للمراحل المبكرة والمتوسطة من المسيرة المهنية — وذلك لريادته في التعلم المهني والتعلم المعزز العميق للتحكم الروبوتي. تمتد مساهماته المنهجية عبر حقبتي التعلم المعزز الكلاسيكية والعميقة: من التعلم المهني عبر التعلم المعزز العكسي (2004) وصولاً إلى TRPO (2015)، وMAML (2017)، وSoft Actor-Critic، والتنويع العشوائي للمجال، وإعادة التجربة بأثر رجعي. شارك في تأسيس Gradescope (استحوذت عليه Turnitin، 2018) وCovariant، وهي شركة نماذج أساسية للروبوتات استحوذت أمازون على تقنيتها في عام 2024؛ في ديسمبر 2025 تم تعيينه رئيسًا لجهود نماذج اللغة الكبيرة في أمازون ضمن منظمة الذكاء العام الاصطناعي الخاصة بها. قد يكون أكثر إسهاماته المؤسسية ديمومة هو خط طلابه: خريجو مخبره شاركوا في تأسيس OpenAI، وPhysical Intelligence، وPerplexity، وSkild، وIdeogram، وGenmo، وأكثر من اثنتي عشرة شركة ذكاء اصطناعي أخرى.
النشأة والتعليم
ولد أبيل في أنتويرب عام 1977 ونشأ في ضاحية براشات القريبة. في المدرسة الثانوية في سانت ميشيل كوليدج، لعب في فريق كرة السلة النادي — وهي رياضة واصلها على المستوى الجامعي. لقد أشار إلى أن إدراكه المبكر أن الذكاء الاصطناعي يمكن أن يكون أداة عالمية عبر التخصصات، وأن الذكاء هو ما يميز البشر بشكل مميز عن الأنواع الأخرى، كان الدافع لدخول هذا المجال.
بكالوريوس وماجستير في الهندسة الكهربائية — جامعة KU Leuven، بلجيكا، 2000
أكمل أبيل كلتا الدرجتين في جامعة KU Leuven، وهي إحدى جامعات الأبحاث الرائدة في بلجيكا، ولعب طوال الوقت في فريق كرة السلة الجامعي.
دكتوراه في علوم الحاسوب — جامعة ستانفورد، 2008
كان أبيل أول طالب دكتوراه لأندرو نغ، الذي كان هو نفسه أستاذًا في سنته الأولى في ستانفورد عندما انضم إليه أبيل. أسست أطروحته، التعلم المهني والتعلم المعزز مع تطبيقات في التحكم الروبوتي، الأسس النظرية والتجريبية للتعلم من الملاحظة — وخاصة إطار استنتاج وظائف المكافأة من سلوك الخبير من خلال التعلم المعزز العكسي. أظهرت الأطروحة أنه يمكن تدريب طائرة هليكوبتر لمضاهاة مستوى مهارة الطيارين البشريين الخبراء في الألعاب البهلوانية من خلال مراقبة طيرانهم بدلاً من برمجتها يدويًا بقواعد التحكم اللازمة. كان ينوي في الأصل فقط الحصول على درجة الماجستير لكنه بقي للحصول على الدكتوراه بسبب تركيز مشاريع الذكاء الاصطناعي في ستانفورد تحت إشراف نغ.
المسيرة المهنية
جامعة كاليفورنيا، بركلي — أستاذ (2008–الآن)
انضم أبيل إلى بركلي كأستاذ مساعد في قسم الهندسة الكهربائية وعلوم الحاسوب في عام 2008، وأسس مختبر بركلي لتعلم الروبوتات فور وصوله، وتمت ترقيته إلى أستاذ كامل مع tenure في عام 2017. في عام 2016 أصبح مديرًا مشاركًا لـ BAIR.
التعلم المهني والتلاعب الروبوتي (2008–2015)
وسعت مجموعة أبيل في بركلي نتائج تعلم طائرات الهليكوبتر المهني إلى مجموعة واسعة من مهام التلاعب. كان الأكثر احتفاءً علنًا هو طي الملابس والقماش — مما أظهر أن الروبوتات يمكنها إدراك والتلاعب بالأشياء القابلة للتشوه من خلال الجمع بين الإدراك البصري الجديد، والتتبع القائم على الفيزياء، والتعلم من الملاحظة. أصبح روبوت طي الملابس صورة أيقونية في التغطية العلمية الشعبية لتعلم الروبوتات، وتم الاستشهاد به على نطاق واسع في التغطية الصحفية بما في ذلك بي بي سي ونيويورك تايمز ورولينج ستون. تضمنت النتائج المبكرة الأخرى لبركلي الخياطة الجراحية وربط العقد.
OpenAI — دور بحثي متزامن (2016)
خلال فترة تداخل مع منصبه كأستاذ في بركلي، كان أبيل منتسبًا إلى OpenAI وشارك في تأليف أبحاث حول التعلم المعزز والتحكم مع جون شولمان وغيره من باحثي OpenAI. تم تطوير إسهامات مجموعته في التعلم المعزز العميق من هذه الحقبة، وخاصة TRPO وGAE، عند تقاطع مخبره في بركلي وبيئة OpenAI المبكرة.
TRPO وGAE (2015)
قدّم Trust Region Policy Optimization (TRPO)، الذي شارك في تأليفه مع جون شولمان وسيرجي ليفين وفيليب موريتز ومايكل جوردان، قيدًا نظريًا مبدئيًا على تحديثات تدرج السياسة الذي مكّن من التعلم المعزز العميق المستقر على نطاق واسع — مما أنتج أولى العروض التوضيحية للحركة ثلاثية الأبعاد في فيزياء المحاكاة. كما وفر Generalized Advantage Estimation (GAE)، وهو أيضًا من هذا التعاون، إطارًا موحدًا لتقليل التباين. أصبحت كلتا الورقتين أساسيتين لعصر التعلم المعزز العميق.
MAML (2017)
قدّم Model-Agnostic Meta-Learning (Finn، Abbeel، Levine؛ ICML 2017) خوارزمية تعلم فوقي قائمة على التدرج تتيح التكيف السريع بعدد قليل من الأمثلة؛ وهي واحدة من أكثر أوراق تعلم الآلة استشهادًا في العقد.
التنويع العشوائي للمجال، SAC، إعادة التجربة بأثر رجعي، محول القرار
مساهمات أخرى في التعلم المعزز العميق من مجموعة أبيل: التنويع العشوائي للمجال (التدريب عبر محاكاة عشوائية متنوعة لتمكين النقل من المحاكاة إلى الواقع)، وSoft Actor-Critic (الآن واحدة من أكثر خوارزميات التعلم المعزز للتحكم المستمر شيوعًا)، وإعادة التجربة بأثر رجعي (تمكين التعلم المعزز في بيئات قليلة المكافآت وموجهة نحو الأهداف)، ومحول القرار (تأطير التعلم المعزز كنمذجة تسلسلية باستخدام محول).
التعلم العميق غير الخاضع للإشراف (CS294-158)
طور أبيل ودرّس التعلم العميق غير الخاضع للإشراف في بركلي — مقرر دراسي للدراسات العليا يغطي النماذج التوليدية بما في ذلك VAEs وnormalizing flows وGANs ونماذج الانتشار والتعلم الذاتي الخاضع للإشراف. تم إصدار محاضرات فيديو من إصدارات متعددة علنًا وتستخدم على نطاق واسع كمواد مرجعية.
Gradescope — مؤسس مشارك (2014–2018)
في عام 2014، شارك أبيل في تأسيس Gradescope مع مهندسين منتسبين إلى بركلي هم أرجون سينغ وسيرجي كاراييف وإبراهيم عوّال. Gradescope هي منصة تصحيح عبر الإنترنت تستخدم الرؤية الحاسوبية والذكاء الاصطناعي لتبسيط تصحيح الواجبات والامتحانات المكتوبة بخط اليد؛ وهي الآن مستخدمة في أكثر من 500 جامعة في جميع أنحاء الولايات المتحدة. استحوذت عليها Turnitin في عام 2018.
Covariant — مؤسس مشارك (2017–2024)
في أكتوبر 2017، شارك أبيل في تأسيس Covariant (المعروفة أصلاً باسم Embodied Intelligence) مع ثلاثة من طلاب الدكتوراه الخاصين به: بيتر تشين، روكي دوان، وتيانهاو تشانغ. كانت مهمة الشركة بناء ذكاء اصطناعي عام يمكّن الروبوتات من إدراك والتلاعب بالأشياء في بيئات المستودعات والمصانع باستخدام التعلم العميق بالمحاكاة والمعزز. انطلقت Covariant علنًا في يناير 2020 وجمعت حوالي 147 مليون دولار عبر جولات تمويل متعددة. منتجها الرئيسي، RFM-1 (Robotics Foundation Model)، يطبق التدريب المسبق لنماذج الأساسيات على مهام التلاعب الروبوتي — مما يضع Covariant عند تقاطع الذكاء الاصطناعي واسع النطاق والأتمتة المادية.
في أغسطس 2024، وافقت أمازون على ترخيص نماذج الأساسيات الروبوتية من Covariant ووظفت مؤسسي الشركة، بما في ذلك أبيل، في منظمة الذكاء الاصطناعي الأوسع لأمازون. وصف تقرير لاحق لواشنطن بوست الترتيب بأنه ترك Covariant نفسها كـ «شركة ناشئة زومبي» بعد الاستحواذ على أصولها وفريقها الرئيسيين.
أمازون — باحث في أمازون ودور الذكاء العام الاصطناعي/نماذج اللغة الكبيرة (2024–الآن)
بعد استحواذ Covariant، انضم أبيل إلى أمازون. في ديسمبر 2025، تم تعيينه لقيادة جهود نماذج اللغة الكبيرة في أمازون ضمن منظمة الذكاء العام الاصطناعي الخاصة بها، مع الاستمرار في العمل على الروبوتات — مما يعكس دمج أمازون لقدرات نماذج الأساسيات مع أنظمة الخدمات اللوجستية المادية والأتمتة الخاصة بها. يحتفظ بمنصبه كأستاذ في بركلي كباحث في أمازون.
AIX Ventures — شريك استثماري (2021)
انضم أبيل إلى AIX Ventures كشريك استثماري في عام 2021، وهو نفس صندوق رأس المال المخاطر الذي يركز على الذكاء الاصطناعي حيث بيرسي ليانغ وريتشارد سوشير شريكان أيضًا.
البودكاست The Robot Brains
يستضيف أبيل The Robot Brains، وهو بودكاست أسبوعي يضم محادثات مع باحثين وممارسين في مجال الذكاء الاصطناعي والروبوتات. أصبح البودكاست أحد الأماكن العامة الأساسية للنقاش المطول حول تعلم الروبوتات وحدودها.
المساهمات الرئيسية
-
التعلم المهني عبر التعلم المعزز العكسي (ICML 2004، مع أندرو نغ) — تقديم إطار استنتاج وظيفة المكافأة من عروض الخبراء واستخدامها لتدريب الوكلاء، مما مكّن من أداء الألعاب البهلوانية بطائرات الهليكوبتر على مستوى الخبراء البشريين؛ أساسي لمجال التعلم بالمحاكاة بأكمله.
-
طي الملابس والتلاعب بالقماش — عرض مخبر بركلي أن الروبوتات يمكنها إدراك والتلاعب بالأشياء القابلة للتشوه باستخدام مزيج من طرق الرؤية والفيزياء والتعلم الجديدة؛ معلم بارز في أبحاث التلاعب الروبوتي ودليل مفهوم عالي المستوى للتلاعب القائم على التعلم.
-
TRPO (Trust Region Policy Optimization) (ICML 2015، مع Schulman، Levine، Moritz، Jordan) — تحديث تدرج السياسة المبدئي مع قيد منطقة الثقة؛ مكّن من التعلم المعزز العميق المستقر على نطاق واسع وأنتج نتائج الحركة ثلاثية الأبعاد الأولى؛ انظر أيضًا صفحة جون شولمان على ويكيبيديا.
-
MAML (Model-Agnostic Meta-Learning) (ICML 2017، مع Finn و Levine) — خوارزمية تعلم فوقي قائمة على التدرج تتيح التكيف السريع بعدد قليل من الأمثلة؛ واحدة من أكثر أوراق تعلم الآلة استشهادًا في العقد.
-
Soft Actor-Critic (SAC) — واحدة من أكثر خوارزميات التعلم المعزز العميق استخدامًا للتحكم المستمر؛ تجمع بين التعلم خارج السياسة والتعلم المعزز بأقصى إنتروبيا من أجل كفاءة العينة والاستقرار.
-
التنويع العشوائي للمجال — إطار يوضح أن التدريب عبر ظروف محاكاة عشوائية متنوعة يمكّن السياسات من التعميم على العالم الحقيقي دون هندسة نقل صريحة من المحاكاة إلى الواقع؛ أصبح الآن ممارسة قياسية في التعلم المعزز الروبوتي.
-
إعادة التجربة بأثر رجعي (HER) — تمكين التعلم المعزز في بيئات قليلة المكافآت وموجهة نحو الأهداف عن طريق إعادة تسمية المسارات الفاشلة بالأهداف التي تم تحقيقها؛ مكّن عمليًا من تعلم التلاعب في بيئات واقعية موجهة نحو الأهداف.
-
محول القرار — تأطير التعلم المعزز كمشكلة نمذجة تسلسلية باستخدام محول، مما يتيح التعلم المعزز خارج الخط عن طريق التكييف على العائد المتبقي؛ مؤثر في سد مجتمعات أبحاث التعلم المعزز ونماذج الأساسيات.
-
نماذج الانتشار (من خلال الطلاب/المتعاونين) — ساهمت مجموعة أبيل في تطوير نماذج الانتشار للروبوتات وسياقات الذكاء الاصطناعي التوليدي.
-
RFM-1 (Robotics Foundation Model) — نموذج Covariant الذي يطبق التدريب المسبق واسع النطاق على التلاعب الروبوتي الصناعي عبر كائنات وإعدادات متنوعة.
-
Gradescope — منصة تصحيح مدعومة بالذكاء الاصطناعي منتشرة الآن في أكثر من 500 جامعة؛ يظهر توجه أبيل الثابت نحو بناء أنظمة مفيدة تتجاوز البحث الخالص.
-
مقرر التعلم العميق غير الخاضع للإشراف (CS294-158) — سلسلة محاضرات متاحة للجمهور تغطي النماذج التوليدية أصبحت مصدرًا قياسيًا لتعليم تعلم الآلة للدراسات العليا.
الجوائز والتكريم
- جائزة ACM في الحوسبة (2021) — مُنحت للمساهمات في تعلم الروبوتات، بما في ذلك التعلم المهني والتعلم المعزز العميق للتحكم الروبوتي؛ مصحوبة بجائزة نقدية قدرها 250,000 دولار.
- جائزة الرئاسة للباحثين والمهندسين في بداية مسيرتهم المهنية (PECASE)
- جائزة NSF CAREER
- برنامج الباحثين الشباب لمكتب البحوث البحرية (ONR-YIP)
- جائزة هيئة التدريس الشابة من داربا (DARPA-YFA)
- 35 تحت 35 من MIT Technology Review (TR35)
- زميل IEEE
- زميل ACM (في انتظار التحقق)
النسب الأكاديمي
سجل أبيل في إرشاد الطلاب هو من بين الأكثر تأثيرًا في تاريخ الذكاء الاصطناعي من حيث تأسيس الشركات:
- جون شولمان — دكتوراه؛ شارك في تأسيس OpenAI؛ طور TRPO وPPO؛ سابقًا في Anthropic؛ الآن في Thinking Machines Lab.
- تشيلسي فين — دكتوراه؛ طورت MAML؛ شاركت في تأسيس Physical Intelligence؛ الآن أستاذة مشاركة في جامعة ستانفورد.
- أرافيند سرينيفاس — دكتوراه؛ شارك في تأسيس Perplexity AI، محرك البحث المعتمد على الذكاء الاصطناعي.
- سيرجي ليفين — دكتوراه (إشراف مشترك)؛ شارك في تأسيس Physical Intelligence؛ الآن أستاذ مشارك في جامعة كاليفورنيا، بركلي.
- بيتر تشين، روكي دوان، تيانهاو تشانغ — طلاب دكتوراه شاركوا في تأسيس Covariant مع أبيل.
- ديباك باثاك — شارك في تأسيس Skild.
- جوناثان هو — شارك في تأسيس Ideogram؛ مساهم رئيسي في أبحاث نماذج الانتشار.
- أجاي جين — شارك في تأسيس Genmo.
- ميشا لاسكين — أسس Reflection AI.
- روشان راو — شارك في تأسيس Evolutionary Scale (نماذج لغة البروتين).
العلاقات الرئيسية
- أندرو نغ — مشرف الدكتوراه في ستانفورد؛ كان أبيل أول طالب دكتوراه على الإطلاق لنغ عندما كان نغ أستاذًا في سنته الأولى؛ أصبح إطار التعلم المهني الذي طوروه معًا مساهمة أبيل المبكرة المميزة.
- جون شولمان — طالب دكتوراه وأطول متعاون بحثي؛ عملهما المشترك على TRPO وGAE هو من بين الأكثر استشهادًا في التعلم المعزز العميق؛ أكمل تأسيس شولمان لاحقًا لـ OpenAI بشبكات أبيل دورة معلم-طالب ذات نطاق غير عادي.
- تشيلسي فين — طالبة دكتوراه؛ MAML هو تعاون ثلاثي بين فين وأبيل وليفين؛ مسيرة فين المهنية اللاحقة في ستانفورد وPhysical Intelligence تعكس أجندة البحث التي طورها مخبر أبيل.
- سيرجي ليفين — خريج دكتوراه وزميل الآن في بركلي؛ جاء فريق تأسيس Physical Intelligence (فين وليفين) مباشرة من عائلة أبيل الأكاديمية؛ علاقة الإشراف المشترك المستمرة بينهما في بركلي تواصل التعاون.
- مايكل آي. جوردان — زميل كبير في بركلي ومؤلف مشارك في TRPO؛ يربط تأثير جوردان على الأسس الرياضية لعمل أبيل في التعلم المعزز جيلين من تعلم الآلة في بركلي.
- بيرسي ليانغ — مستثمر مشارك في AIX Ventures؛ موقعهما المشترك داخل مجتمع الذكاء الاصطناعي في بركلي/ستانفورد وAIX Ventures يعكس الشبكة المؤسسية الكثيفة حول أبحاث الذكاء الاصطناعي في منطقة الخليج.
الأسلوب الشخصي
تتميز أجندة أبحاث أبيل بدافع ثابت لجعل الروبوتات مفيدة حقًا في العالم المادي بدلاً من كونها مثيرة للإعجاب في عروض المختبر الخاضعة للرقابة. تم اختيار معالم مجموعته — الألعاب البهلوانية بالهليكوبتر، وطي الملابس، والخياطة الجراحية، والتلاعب في المستودعات — عمدًا لمزيجها من الاعتراف العام والصعوبة التقنية؛ لقد أظهروا أن الأساليب القائمة على التعلم يمكنها التعامل مع الواقع الفوضوي والقابل للتشوه والملاحظ جزئيًا للمهام المادية بدلاً من المهام النظيفة والصلبة والمحددة جيدًا فقط. تعكس استثماراته المؤسسية — BAIR، Covariant، Gradescope، مقرر التعلم العميق غير الخاضع للإشراف، بودكاست The Robot Brains — التزامًا موازيًا بالبنية التحتية والوصول: بناء المنصات التي يتم من خلالها إجراء البحث والتي من خلالها يتفاعل المجتمع الأوسع معه. يشير أسلوبه على تويتر (35.8% «إعلام»، 21.5% «إعلان»، 10% «تعليم») والموضوع المهيمن لترويج بودكاست The Robot Brains إلى وجود متواصل يرى نفسه بقدر ما هو باني نظام بيئي كما هو باحث أساسي.