جين لايكي

باحث ألماني في سلامة الذكاء الاصطناعي، يقود فريق علم المحاذاة (Alignment Science) في شركة أنثروبيك (Anthropic)، معروف بالمشاركة في ابتكار نموذج التعلم المعزز من التغذية الراجعة البشرية (RLHF) وباستقالته العلنية من شركة أوبن إيه آي (OpenAI) بسبب مخاوف تتعلق بالسلامة.


نبذة شخصية

تاريخ الميلاد 1986 أو 1987، ألمانيا
الجنسية ألماني
المؤسسة الحالية أنثروبيك (قائد فريق علم المحاذاة)
مجالات البحث محاذاة الذكاء الاصطناعي، التعلم المعزز من التغذية الراجعة البشرية، الإشراف القابل للتوسع، التعميم من الضعيف إلى القوي، أبحاث المحاذاة الآلية
المشرف على الدكتوراه ماركوس هوتر
أطروحة الدكتوراه التعلم المعزز العام غير المعلمي (الجامعة الوطنية الأسترالية، 2016)
الموقع الشخصي jan.leike.name
المدونة aligned.substack.com
إكس / تويتر @janleike
جيت هب janleike
جوجل سكولار Jan Leike

لمحة عامة

يعد يان لايك أحد أكثر الباحثين تأثيراً في تاريخ محاذاة الذكاء الاصطناعي، حيث يشغل موقعاً نادراً عند تقاطع النظرية الأساسية والعمل على الأنظمة الحدودية. كباحث في ديب مايند (DeepMind)، شارك في ابتكار نموذج التعلم المعزز من التغذية الراجعة البشرية — التقنية التي أصبحت العمود الفقري لنماذج اللغة الحديثة المتوافقة. في أوبن إيه آي، شارك في قيادة فريق المحاذاة الفائقة (Superalignment) إلى جانب إيليا سوتسكيفر، وأشرف على محاذاة نماذج InstructGPT وChatGPT وGPT-4، وشارك في كتابة خارطة الطريق البحثية الأبرز في المجال لمحاذاة الأنظمة فائقة الذكاء. أصبحت استقالته من أوبن إيه آي في مايو 2024 — المصحوبة ببيان عام مفاده أن ثقافة السلامة أصبحت “في المرتبة الثانية بعد المنتجات البراقة” — واحدة من اللحظات الحاسمة في التاريخ العام لسلامة الذكاء الاصطناعي. انضم إلى أنثروبيك بعد ذلك بوقت قصير، حيث يقود فريق علم المحاذاة. أدرجته مجلة تايم (TIME) ضمن قائمة أكثر 100 شخصية تأثيراً في مجال الذكاء الاصطناعي في عامي 2023 و2024.


النشأة والتعليم

نشأ لايك في ألمانيا. حصل على شهادته الجامعية من جامعة فرايبورغ، وبعد حصوله على درجة الماجستير في علوم الكمبيوتر، تابع الدكتوراه في التعلم الآلي في الجامعة الوطنية الأسترالية تحت إشراف ماركوس هوتر. هوتر هو مبتكر نموذج AIXI، وهو نموذج نظري لعامل عالمي الذكاء، والإطار الفكري لعمل لايك في الدكتوراه — التعلم المعزز العام غير المعلمي — متجذر في تقليد نظرية المعلومات الخوارزمية التي ابتكرها هوتر. تناولت أطروحته، التعلم المعزز العام غير المعلمي (2016)، أسئلة أساسية حول الحدود النظرية لعوامل التعلم المعزز في بيئات خالية من الافتراضات المعلمية.

بعد الدكتوراه، أمضى لايك ستة أشهر كزميل ما بعد الدكتوراه في معهد مستقبل الإنسانية (Future of Humanity Institute) في أكسفورد قبل الانضمام إلى ديب مايند للتركيز على أبحاث سلامة الذكاء الاصطناعي التجريبية.


المسيرة المهنية

ديب مايند (حوالي 2016–2021)

في فريق السلامة في ديب مايند في لندن، ابتكر لايك نموذج التعلم المعزز من التغذية الراجعة البشرية. الورقة البحثية الفارقة، التعلم المعزز العميق من التفضيلات البشرية (NeurIPS 2017)، التي شارك في كتابتها بول كريستيانو وتوم براون وميلجان مارتيتش وشين ليغ وداريو أمودي، اقترحت تدريب عوامل التعلم المعزز باستخدام مقارنات بشرية غير خبيرة بين أجزاء المسار بدلاً من وظائف المكافأة المحددة يدوياً. أظهرت الورقة أنه يمكن تعلم سلوكيات جديدة معقدة باستخدام حوالي ساعة من الوقت البشري، في بيئات أكثر تعقيداً بكثير من أي بيئة تم التعلم منها سابقاً باستخدام التغذية الراجعة البشرية. أسس هذا العمل نموذج RLHF كتقنية محاذاة عملية وأصبح لاحقاً النواة المنهجية لنماذج InstructGPT وChatGPT وكلود (Claude).

خلال هذه الفترة، نشر لايك أيضاً محاذاة العامل القابلة للتوسع عبر نمذجة المكافأة: اتجاه بحثي (2018)، بالاشتراك مع ديفيد كرويغر وتوم إيفريت وشين ليغ، والذي أوجز برنامجاً بحثياً لتوسيع نطاق المحاذاة عبر نمذجة المكافأة المتكررة — وهي صياغة رسمية مبكرة لما سيصبح لاحقاً أجندة المحاذاة الفائقة.

أوبن إيه آي (2021–مايو 2024)

انضم لايك إلى أوبن إيه آي في عام 2021 كرئيس لقسم المحاذاة. شارك في تطوير InstructGPT وChatGPT ومحاذاة GPT-4، وهو مؤلف مشارك في ورقة InstructGPT (NeurIPS 2022)، والتي قدمت الضبط الدقيق الخاضع للإشراف متبوعاً بتدريب RLHF لإنتاج نموذج يتبع التعليمات البشرية بشكل أفضل.

في يونيو 2023، أصبح هو وإيليا سوتسكيفر قادة مشروع المحاذاة الفائقة المُقدم حديثاً، والذي يهدف إلى تحديد كيفية محاذاة أنظمة الذكاء الاصطناعي فائقة الذكاء المستقبلية في غضون أربع سنوات. أُعلن عن المشروع مع التزام عام بأن أوبن إيه آي ستخصص 20% من قدرتها الحاسوبية لأبحاث المحاذاة الفائقة. كما طور لايك نهج أوبن إيه آي لأبحاث المحاذاة وشارك في كتابة خارطة الطريق البحثية لفريق المحاذاة الفائقة.

الاستقالة. في مايو 2024، استقال لايك من أوبن إيه آي، في غضون ساعات من استقالة إيليا سوتسكيفر. كان بيان استقالته العلني على إكس مباشراً بشكل غير معتاد. اتهم أوبن إيه آي وقادتها بإهمال ثقافة السلامة لصالح المنتجات البراقة، وقال إنه “كان على خلاف مع قيادة أوبن إيه آي حول الأولويات الأساسية للشركة لبعض الوقت، حتى وصلنا أخيراً إلى نقطة الانهيار.” كتب أن “بناء آلات أذكى من البشر هو مسعى خطير بطبيعته” وأن “أوبن إيه آي يجب أن تصبح شركة AGI تضع السلامة أولاً.” وأشار إلى أن فريقه كان “يبحر عكس الريح” ويكافح لتأمين الموارد الحاسوبية على الرغم من التزامات أوبن إيه آي العلنية. في غضون أيام، حلَّت أوبن إيه آي فريق المحاذاة الفائقة بالكامل، وأعادت توزيع الأعضاء على مجموعات بحثية أخرى.

أنثروبيك (مايو 2024–حتى الآن)

في مايو 2024، انضم لايك إلى أنثروبيك، وهي شركة ذكاء اصطناعي أسسها موظفون سابقون في أوبن إيه آي. يقود فريق علم المحاذاة، الذي يعمل على أصعب المشكلات المفتوحة في جعل أنظمة الذكاء الاصطناعي تتصرف كما هو مقصود في المهام التي يصعب أو لا يكفي فيها التقييم البشري. يبحث فريقه في كيفية محاذاة باحث محاذاة آلي، ويعمل على الإشراف القابل للتوسع، والتعميم من الضعيف إلى القوي، والمتانة ضد هجمات الاختراق (jailbreaks).


المساهمات الرئيسية

  • التعلم المعزز العميق من التفضيلات البشرية (NeurIPS 2017) — شارك في كتابتها بول كريستيانو وتوم براون وميلجان مارتيتش وشين ليغ وداريو أمودي في ديب مايند. قدمت الورقة النسخة العملية من RLHF، بتدريب العوامل من مقارنات بشرية غير خبيرة لأجزاء المسار. أصبحت الأساس المنهجي لمحاذاة نماذج اللغة الحديثة الكبيرة بما في ذلك InstructGPT وChatGPT وكلود وغيرها.

  • محاذاة العامل القابلة للتوسع عبر نمذجة المكافأة (2018) — بالاشتراك مع كرويغر وإيفريت ومارتيتش ومايني وليغ. أوجزت أجندة بحثية منهجية لنمذجة المكافأة المتكررة كمسار لمحاذاة قابلة للتوسع؛ مخطط أولي لما سيدعم لاحقاً برنامج المحاذاة الفائقة.

  • InstructGPT — تدريب نماذج اللغة على اتباع التعليمات بالتغذية الراجعة البشرية (NeurIPS 2022) — مؤلف كبير في الورقة التي قدمت InstructGPT، والتي جمعت بين الضبط الدقيق الخاضع للإشراف وRLHF لإنتاج نماذج لغة متوافقة بشكل كبير مع القصد البشري. مكّن هذا العمل مباشرة من تطوير ChatGPT.

  • خارطة طريق أبحاث المحاذاة الفائقة (2023) — شارك في القيادة مع إيليا سوتسكيفر؛ شارك في كتابة الخطة الفنية لمحاذاة الأنظمة فائقة الذكاء في غضون أربع سنوات باستخدام الذكاء الاصطناعي الحالي أو القريب المدى لأتمتة أبحاث المحاذاة. قدم مفهوم التعميم من الضعيف إلى القوي كنهج تقني أساسي.

  • التعميم من الضعيف إلى القوي (ICML 2024) — شارك في كتابتها كولين بيرنز وبافيل إزميلوف ويان هندريك كيرشنر وآخرين بما في ذلك إيليا سوتسكيفر. اقترحت وأثبتت تجريبياً أنه يمكن استخدام إشراف نموذج ضعيف لاستخراج قدرات قوية من نموذج أكثر قوة — وهي آلية رئيسية لمحاذاة الأنظمة الأذكى من مشرفيها.

  • نقاد LLM يساعدون في اكتشاف أخطاء LLM (2024) — أول عمل من فريق المحاذاة في أوبن إيه آي يوضح أن GPT-4 يمكنه تحديد الأخطاء في مخرجاته بمعدلات ذات معنى، مما يساهم في برنامج أبحاث الإشراف القابل للتوسع.

  • مدونة Aligned Substack — مدونة بحثية نشطة ينشر فيها لايك معالجات سهلة لمفاهيم المحاذاة، بما في ذلك مقالات تأسيسية حول “المشكلة الصعبة للمحاذاة” والإشراف القابل للتوسع وأبحاث المحاذاة الآلية؛ مؤثرة في تشكيل المفردات المفاهيمية للمجال.


الجوائز والتكريم

  • TIME100 AI (2023 و2024) — واحد من عدد قليل جداً من الباحثين المدرجين في كلا النسختين؛ تم الاستشهاد به لمساهماته في أبحاث محاذاة الذكاء الاصطناعي ولصراحته العامة بشأن مخاطر السلامة.
  • بيان الاستقالة العلني (مايو 2024) — وُصف على نطاق واسع بأنه لحظة فارقة في التاريخ العام لسلامة الذكاء الاصطناعي؛ غطته كبرى وسائل الإعلام على مستوى العالم وأُشيد به لإبرازه النقاشات حول ثقافة السلامة داخل مختبرات الذكاء الاصطناعي الحدودية.

العلاقات الرئيسية

  • ماركوس هوتر — المشرف على الدكتوراه في الجامعة الوطنية الأسترالية؛ مبتكر AIXI وإطار الذكاء العالمي النظري الذي شكل أبحاث لايك المبكرة حول التعلم المعزز العام غير المعلمي.
  • بول كريستيانو — المؤلف المشارك الرئيسي لورقة RLHF لعام 2017؛ أسس لاحقاً مركز أبحاث المحاذاة (ARC) ثم فريق التفسير الآلي والمحاذاة. أحد أقرب المتعاونين الفكريين في مسيرة لايك.
  • شين ليغ — مؤلف مشارك في كل من ورقة RLHF لعام 2017 وورقة نمذجة المكافأة لعام 2018؛ المؤسس المشارك لديب مايند. تم عمل لايك في ديب مايند ضمن دائرة السلامة لليغ.
  • داريو أمودي — مؤلف مشارك في ورقة RLHF لعام 2017 (كان آنذاك في أوبن إيه آي)؛ الآن الرئيس التنفيذي لأنثروبيك، المنظمة التي انضم إليها لايك بعد مغادرته أوبن إيه آي. وبالتالي، فإن تعاونهما البحثي يؤطر قصة سلامة الذكاء الاصطناعي للعقد.
  • إيليا سوتسكيفر — شارك في قيادة فريق المحاذاة الفائقة؛ مثلت استقالاتهما المتزامنة من أوبن إيه آي في مايو 2024 أبرز نزوح موجه بالسلامة من مختبر ذكاء اصطناعي حداثي في تاريخ المجال.
  • سام ألتمان — الرئيس التنفيذي لأوبن إيه آي الذي وصل لايك معه إلى “نقطة الانهيار” حول أولويات السلامة للشركة؛ بلور الخلاف العام نقاشاً أوسع حول الحوكمة والقيم في المختبرات الحدودية.

الأسلوب الشخصي

صوت لايك العلني مباشر ومبدئي بشكل غير معتاد لشخصية بارزة في صناعة تنافسية تجارياً. بيان استقالته لعام 2024 — النادر لاستعداده لتسمية إخفاقات مؤسسية محددة بشكل علني وغير مجهول — يعكس نمطاً ثابتاً: فهو يؤطر محاذاة الذكاء الاصطناعي ليس كاهتمام تقني متخصص بل كالتزام حضاري، ويعامل المصداقية المؤسسية في مجال السلامة على أنها شيء يجب اكتسابه من خلال العمل المتسق بدلاً من تأكيده من خلال بيانات المهمة. كتاباته البحثية دقيقة تقنياً ولكنها سهلة المنال، وتوضح مدونته على Substack مفاهيم المحاذاة لجمهور يمتد من ممارسي التعلم الآلي إلى القراء المهتمين بالسياسات. اتبعت مسيرته المهنية خيطاً ثابتاً من أسس التعلم المعزز النظرية تحت إشراف ماركوس هوتر مروراً بابتكار RLHF التجريبي في ديب مايند وصولاً إلى محاذاة مستوى الأنظمة في أوبن إيه آي وأنثروبيك الآن — دائماً على الحدود حيث تلتقي أسئلة السلامة المجردة مع الأنظمة المنشورة.


المراجع