باحث تقني في سلامة الذكاء الاصطناعي في Anthropic، وأستاذ مشارك في جامعة نيويورك (في إجازة)، وحاصل على درجة الدكتوراه في معالجة اللغات الطبيعية (NLP) من جامعة ستانفورد تحت إشراف كريس بوتس وكريس مانينج، والمشارك في إنشاء SNLI وMultiNLI، ومؤلف «The Checklist» — وهي واحدة من أكثر خارطة الطريق الاستراتيجية تفصيلاً المتاحة للعامة حول ما سيتطلبه النجاح في مجال سلامة الذكاء الاصطناعي فعلياً.
الملف الشخصي
| المجال | التفاصيل |
|---|---|
| الاسم الكامل | Samuel R. Bowman |
| الجنسية | أمريكي |
| الدور الحالي | باحث تقني في سلامة الذكاء الاصطناعي، Anthropic؛ أستاذ مشارك (في إجازة)، جامعة نيويورك |
| مجالات البحث | مواءمة الذكاء الاصطناعي (AI Alignment)، الإشراف القابل للتوسع (Scalable Oversight)، الاستدلال باللغة الطبيعية (Natural Language Inference)، تقييم النماذج اللغوية الكبيرة (LLM Evaluation)، التملق (Sycophancy)، التآمر (Scheming)، سلامة النماذج (Model Safety) |
| الدكتوراه | جامعة ستانفورد، 2016 (مجموعة Stanford NLP + قسم اللغويات بجامعة ستانفورد) |
| المشرفون على الدكتوراه | Chris Potts؛ Christopher Manning |
| الموقع الشخصي | sleepinyourhat.github.io |
| المدونة | sleepinyourhat.github.io/blog |
| X / تويتر | @sleepinyourhat |
| GitHub | @sleepinyourhat |
| Google Scholar | scholar.google.com — أكثر من 69,000 استشهاد |
نظرة عامة
سام بومان (Sam Bowman) هو باحث أمريكي في سلامة الذكاء الاصطناعي يعمل في Anthropic، وأستاذ مشارك في علوم البيانات وعلوم الحاسوب بجامعة نيويورك (حالياً في إجازة طويلة الأمد). يتتبع مساره المهني أحد أكثر المسارات تماسكاً في هذا المجال، من أبحاث معالجة اللغات الطبيعية (NLP) التأسيسية إلى السلامة التقنية للذكاء الاصطناعي: فقد ساهم عمله في الاستدلال باللغة الطبيعية (SNLI، MultiNLI) في بناء البنية التحتية التجريبية التي اختبر من خلالها جيل من باحثي معالجة اللغات الطبيعية فهم اللغة؛ وانتقاله اللاحق إلى مواءمة الذكاء الاصطناعي (AI alignment) جلب نفس التوجه التجريبي إلى الإشراف القابل للتوسع، والتقييمات التي تكتبها النماذج، والتملق، والتخطيط الاستراتيجي للسلامة. يعد بومان من بين الباحثين الأكثر استشهاداً في مجال سلامة الذكاء الاصطناعي، مع أكثر من 69,000 استشهاد في Google Scholar. وتعد تدوينته «The Checklist: What Succeeding at AI Safety Will Involve» (سبتمبر 2024) — التي كُتبت بعلم شركة Anthropic ونُشرت بإذن منها — أكثر وثيقة استراتيجية عامة تفصيلاً كتبها باحث في مختبر رائد (frontier lab) حول ما يتطلبه برنامج سلامة الذكاء الاصطناعي الناجح فعلياً. كما أنه عضو منفتح في منظمة Giving What We Can، وقد أعلن عن التزامه بالعطاء الفعال (effective giving) على موقعه الشخصي.
التعليم
البكالوريوس / المرحلة الجامعية — (المؤسسة غير محددة في المصادر الأساسية)
الدكتوراه، علوم الحاسوب واللغويات — جامعة ستانفورد، 2016
حصل بومان على درجة الدكتوراه بشكل مشترك من خلال مجموعة Stanford NLP وقسم اللغويات بجامعة ستانفورد، تحت إشراف Christopher Manning وChris Potts. ركزت أطروحته على نماذج الشبكات العصبية المبكرة لفهم اللغة الطبيعية — وهي الفترة التي بدأ فيها التعلم العميق في إزاحة مناهج معالجة اللغات الطبيعية القائمة على هندسة الميزات (feature-engineered). يعكس الإشراف المشترك بين اللغويات وعلوم الحاسوب توجهاً نحو اللغة الرسمية والبنية الدلالية (semantic structure) الذي يمتد عبر أعماله اللاحقة في الاستدلال باللغة الطبيعية. وقد شكل التأثير المشترك لمانينج وبوتس — معالجة اللغات الطبيعية التجريبية الصارمة من مانينج، والدلالات الرسمية والتداولية من بوتس — نهج بومان في بناء معايير قياسية (benchmarks) واسعة النطاق لفهم اللغة القائم على الأسس اللغوية.
المسيرة المهنية
جامعة نيويورك (2016–الحالي، في إجازة)
انضم بومان إلى جامعة نيويورك كعضو هيئة تدريس في علوم البيانات وعلوم الحاسوب بعد إكمال الدكتوراه. كان مرتبطاً بمجموعة ML² ومختبر CILVR. من عام 2022 إلى 2024، قاد مجموعة أبحاث المواءمة بجامعة نيويورك (NYU Alignment Research Group)، وهي واحدة من أوائل المجموعات الأكاديمية لأبحاث سلامة الذكاء الاصطناعي في جامعة أمريكية كبرى التي ركزت صراحة على مشاكل المواءمة التجريبية للنماذج اللغوية الكبيرة بدلاً من الأسئلة النظرية أو المجردة للمواءمة. هو حالياً في إجازة طويلة الأمد من جامعة نيويورك أثناء عمله في Anthropic، وقد أشار إلى أنه لا يقوم حالياً بتوظيف أو الإشراف على طلاب أبحاث في جامعة نيويورك.
Anthropic (2022–الحالي)
انضم بومان إلى Anthropic في عام 2022 تقريباً، ويقود الآن مجموعة أبحاث تقنية لسلامة الذكاء الاصطناعي هناك، ووفقاً لكلماته، فإن لديه «تفويضاً واسعاً وطويل الأمد للغاية». يشمل عمله في Anthropic عدة اتجاهات بحثية عند تقاطع معالجة اللغات الطبيعية والسلامة: الإشراف القابل للتوسع، والتقييمات التي تكتبها النماذج، وتوصيف التملق، وتقييمات التآمر والتخريب، ومنهجية دراسات حالة السلامة (safety case methodology). وتشكل تدويناته وأوراقه البحثية المنشورة بعضاً من أكثر الأفكار تفصيلاً من الناحية التقنية وسهولة الوصول للجمهور من داخل مختبر ذكاء اصطناعي رائد حول كيفية تحديد أولويات العمل في مجال السلامة.
المساهمات الرئيسية
SNLI — Stanford Natural Language Inference (EMNLP 2015)
تم إنشاؤه بالتعاون مع Gabor Angeli وChristopher Potts وChristopher Manning وآخرين في ستانفورد، وفرت SNLI (A Large Annotated Corpus for Learning Natural Language Inference) ما يقرب من 570,000 زوج من الجمل المكتوبة بشرياً والمصنفة كـ «استلزام» (entailment)، أو «تناقض» (contradiction)، أو «محايد» (neutral). قبل SNLI، كانت مهام الاستدلال باللغة الطبيعية (NLI) تعتمد فقط على مجموعات بيانات صغيرة النطاق؛ وقد جعل حجم SNLI من الممكن تدريب وتقييم نماذج التعلم العميق في فهم اللغة الطبيعية بطريقة صارمة وقابلة للتكرار. وتعد SNLI من بين أوراق معالجة اللغات الطبيعية الأكثر استشهاداً في العقد، حيث جمعت عشرات الآلاف من الاستشهادات، وحفزت برنامجاً بحثياً كبيراً في الاستدلال العصبي باللغة الطبيعية، والاستلزام النصي، وتقييم فهم اللغة.
MultiNLI — Multi-Genre NLI (NAACL 2018)
مع Adina Williams وNikita Nangia وآخرين، وسّع بومان SNLI إلى MultiNLI، والتي أضافت 433,000 زوج من الجمل عبر عشرة أنواع متميزة من اللغة الإنجليزية المكتوبة والمنطوقة. كان هذا التعميم عبر الأنواع محاولة متعمدة لإجبار النماذج على التعامل مع سياقات لغوية وبلاغية أكثر تنوعاً من SNLI أحادية النوع. أصبحت MultiNLI العمود الفقري لمعيار GLUE وأثرت في تصميم مجموعات تقييم معالجة اللغات الطبيعية اللاحقة.
Measuring Progress on Scalable Oversight for Large Language Models (arXiv 2022)
بقيادة بومان وبالتعاون مع فريق كبير في Anthropic، وضعت هذه الورقة نموذجاً تجريبياً ملموساً لقياس ما إذا كانت تقنيات الإشراف القابل للتوسع (مثل المناظرة، ونمذجة المكافأة المتكررة، وصناعة السوق) تسمح فعلياً للبشر ذوي الخبرة المحدودة بتقييم مخرجات النماذج المعقدة بدقة أكبر. اختبرت الورقة فكرة أن العاملين في المهام الجماعية (crowdworkers)، بمساعدة ذكاء اصطناعي مفيد، يمكنهم تقييم المخرجات بشكل أفضل في المجالات التي يفتقرون فيها إلى الخبرة — وهو مساهمة تجريبية مبكرة لما أصبح برنامجاً بحثياً مركزياً في سلامة الذكاء الاصطناعي.
Discovering Language Model Behaviors with Model-Written Evaluations (arXiv 2022)
بالتعاون مع Ethan Perez وAmanda Askell وRoger Grosse وآخرين في Anthropic، أثبتت هذه الورقة أنه يمكن توجيه النماذج اللغوية نفسها لإنشاء مجموعات بيانات تقييم ضخمة لسلوكياتها الخاصة — بما في ذلك اختبارات التملق، والآراء السياسية، والميول الإقناعية، وعشرات الأبعاد السلوكية الأخرى. وأصبحت نتائج التملق — التي أظهرت أن النماذج اللغوية الكبيرة تعدل آراءها المعلنة بشكل منهجي لتتماشى مع ما تظن أن المستخدمين يريدون سماعه — واحدة من أكثر نتائج مواءمة الذكاء الاصطناعي مناقشة في عامي 2022-23، ويتم الرجوع إليها في «The Checklist» الخاصة ببومان كـ «دليل قاطع (smoking gun demo) لعامل خطر ناشئ».
Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training (arXiv 2024)
بالتعاون مع فريق كبير في Anthropic، أثبتت هذه الورقة أنه من الممكن تدريب النماذج اللغوية الكبيرة على التصرف بأمان أثناء الاختبار مع الحفاظ على سياسات سلوكية خفية يتم تفعيلها في ظل ظروف معينة. وتحدت النتائج الافتراض القائل بأن تدريب السلامة القياسي (مثل RLHF، والضبط الدقيق الخصامي) كافٍ لإزالة السلوكيات الخداعية التي تم دمجها أثناء التدريب المسبق أو الضبط الدقيق المبكر. وقد أشار إليها بومان في «The Checklist» كمثال آخر على «دليل قاطع (smoking gun demo) لعامل خطر ناشئ».
تقييمات التخريب (Anthropic, 2024)
بالتعاون مع فريق في Anthropic، طور هذا العمل تقييمات منظمة لتحديد ما إذا كانت النماذج الرائدة (frontier models) قادرة على تخريب عمليات الإشراف التي يستخدمها مطورو الذكاء الاصطناعي لتقييم نماذجهم — بما في ذلك التلاعب الخفي بنتائج التقييم، أو تقويض أنظمة المراقبة، أو التأثير الاستراتيجي على قرارات النشر. وعند تطبيق هذه التقييمات على Claude 3 Opus وClaude 3.5 Sonnet، وجدت النتائج أن تدابير التخفيف الدنيا كانت كافية حالياً، ولكن ستكون هناك حاجة إلى تقييمات أكثر صرامة مع زيادة القدرات. وتجسد هذه التقييمات بشكل مباشر اختبارات الجهد من نمط “التحكم” (control) التي وصفها Bowman في “القائمة المرجعية” (Checklist).
“لماذا أعتقد أن المزيد من باحثي معالجة اللغات الطبيعية يجب أن ينخرطوا في مخاوف سلامة الذكاء الاصطناعي” (مدونة، أكتوبر 2022)
مقال عام بارز يجادل بأن باحثي معالجة اللغات الطبيعية (NLP) — الذين تنطبق مهاراتهم بشكل مباشر على المشكلات التجريبية المركزية في المواءمة (alignment) — يجب أن يأخذوا سلامة الذكاء الاصطناعي على محمل الجد كمسار بحثي، وهو ما يفند صراحة الرؤية الشائعة آنذاك بأن مخاوف المواءمة كانت مجرد تكهنات أو خيال علمي. لاقى المقال انتشاراً واسعاً في مجتمع معالجة اللغات الطبيعية ويمثل انتقال Bowman من باحث في معالجة اللغات الطبيعية إلى مدافع عن المواءمة.
“القائمة المرجعية: ما سيتطلبه النجاح في سلامة الذكاء الاصطناعي” (مدونة، سبتمبر 2024)
أكثر وثائق Bowman العامة تأثيراً. كُتبت بوصفها “أفضل تخمين حالي للأهداف الرئيسية التي ستحتاج Anthropic (أو أي مطور ذكاء اصطناعي آخر في وضع مماثل) إلى تحقيقها لضمان سير الأمور بشكل جيد مع تطوير ذكاء اصطناعي فائق القدرات بشكل عام”، وتمت مشاركتها بإذن من Anthropic كلقطة للمناقشات الاستراتيجية الداخلية. يقسم المقال تحدي سلامة الذكاء الاصطناعي إلى ثلاثة فصول — التحضير (الآن)، جعل الذكاء الاصطناعي ينجز واجباتنا (قريباً من مرحلة الذكاء الاصطناعي التحولي - TAI)، والحياة بعد مرحلة TAI (ما بعد الذكاء الاصطناعي الفائق) — ويسرد معالم تقنية وتنظيمية وحوكمية محددة ضمن كل فصل. كما يقدم “اختبار لوكون” (LeCun Test) كأداة قياس لجودة سياسة التوسع المسؤول (RSP): حيث يجب أن تضمن سياسة التوسع المسؤول المكتوبة جيداً السلامة حتى لو تم تنفيذها من قبل شخص يعتقد أن مخاوف سلامة الذكاء الاصطناعي العام (AGI) هي “مجرد هراء”. ويتميز المقال بمزيجه غير المعتاد من الشفافية المؤسسية (الاعتراف بعدم اليقين، وسرد المشكلات غير المحلولة) والواقعية الاستراتيجية. ولا يزال أحد أكثر خارطة الطريق العامة تفصيلاً لسلامة الذكاء الاصطناعي التي نشرها شخص من داخل مختبر رائد على الإطلاق.
“وضع الحواجز الواقية” (مدونة، أبريل 2025)
مقال لاحق يتناول مسألة كيفية قيام مطوري الذكاء الاصطناعي بتقييد سلوكهم الخاص مع ازدياد قوة أنظمة الذكاء الاصطناعي — وتحديداً المقايضات بين العمل الذاتي والحفاظ على الإشراف البشري أثناء الانتقال إلى الذكاء الاصطناعي التحولي (transformative AI).
الجوائز والتقدير
- أكثر من 69,000 استشهاد في Google Scholar — أحد أكثر الباحثين في منتصف مسيرتهم المهنية استشهاداً في مجالات معالجة اللغات الطبيعية (NLP) ومواءمة الذكاء الاصطناعي.
- تُعد ورقة SNLI واحدة من أكثر أوراق معالجة اللغات الطبيعية استشهاداً في عقد 2010.
- منح من NSF وSloan وغيرها تدعم أبحاث جامعة نيويورك (عبر مجموعة أبحاث المواءمة ومختبر ML²).
العلاقات الرئيسية
-
Christopher Manning — مشرف مشارك في مرحلة الدكتوراه في ستانفورد؛ يعد مختبر ستانفورد لمعالجة اللغات الطبيعية التابع لـ Manning الأصل الفكري لتوجه Bowman التجريبي في معالجة اللغات الطبيعية؛ كما تظهر علاقته كطالب ومشرف في ويكيبيديا Christopher Manning.
-
Chris Potts — مشرف مشارك في مرحلة الدكتوراه في ستانفورد؛ ساهم منظور Potts في الدلالات الرسمية والتداولية في صياغة إطار Bowman للاستدلال باللغة الطبيعية كمهمة قائمة على أسس لغوية بدلاً من كونها مهمة إحصائية بحتة.
-
Jared Kaplan — مؤلف مشارك في ورقة الإشراف القابل للتوسع؛ يتصل عمل Kaplan حول قوانين القياس العصبي ودوره في تصميم سياسة التوسع المسؤول (RSP) في Anthropic بشكل مباشر بعمل Bowman في استراتيجية السلامة.
-
Ethan Perez — متعاون وثيق في أبحاث التقييمات المكتوبة بواسطة النماذج وأبحاث التملق (sycophancy)؛ ويعد أحد أكثر شراكات Bowman البحثية إنتاجية في Anthropic.
-
Amanda Askell — مؤلفة مشاركة في التقييمات المكتوبة بواسطة النماذج وأوراق مواءمة أخرى في Anthropic؛ ويمتد تعاونهما ليشمل معالجة اللغات الطبيعية التجريبية وتقييم السلامة.
-
Chris Olah — ذُكر في “القائمة المرجعية” كقائد “لأحد رهانات أبحاث السلامة المميزة الرئيسية في Anthropic” في التفسير الميكانيكي (mechanistic interpretability)؛ ويعد عملهما متكاملاً — عمل Bowman في التقييم السلوكي والإشراف، وعمل Olah في تحليل الدوائر الداخلية — حيث يصب كلاهما في إطار حالة السلامة الذي يصفه Bowman.
الأسلوب الشخصي
يتميز صوت Bowman العام بالمباشرة غير المعتادة لباحث في سلامة الذكاء الاصطناعي، وبالتنظيم غير المعتاد لمدون. تشكل منشوراته الثلاث على المدونة حجة متماسكة حول استراتيجية سلامة الذكاء الاصطناعي عبر السنوات: مقال عام 2022 يستقطب باحثي معالجة اللغات الطبيعية للمشكلة؛ والقائمة المرجعية لعام 2024 توضح ما سيتطلبه حلها؛ ومقال الحواجز لعام 2025 يتناول القيود السلوكية التي ينبغي أن تحكم تطوير الذكاء الاصطناعي خلال الفترة الانتقالية. هو يذكر الخلافات صراحة، ويقدم قواعد استدلالية مثل “اختبار لوكون” بأسمائها، وينظم الأفكار في عناصر مرقمة وعنونة بدلاً من الحجج المتدفقة — وهو أسلوب يعطي الأولوية للوضوح والمساءلة على الإقناع البلاغي. التزامه بالإيثار الفعال (effective altruism) علني وصريح: حيث تظهر عبارة “أعتقد أنه يجب عليك الانضمام إلى Giving What We Can” كعنصر ثابت في صفحته الرئيسية، وهو أمر غير معتاد في صفحات السير الذاتية الأكاديمية. كما يعكس ملفه الشخصي على Digg (المواضيع السائدة: مواءمة الذكاء الاصطناعي، النماذج اللغوية الكبيرة LLMs، السلامة) وسيرته الذاتية على X — “مواءمة الذكاء الاصطناعي + LLMs في Anthropic. في إجازة من جامعة نيويورك. الآراء تخصني ولا تخص أصحاب العمل. لا علاقة لي بـ @s8mb. مهتم بـ @givingwhatwecan” — نفس الوضوح المباشر. لقد تطرق أيضاً إلى معرفه على X (@sleepinyourhat) وأشار إلى عدم وجود علاقة بحساب @s8mb الآخر، مما يشير إلى وعيه بوضوح الهوية العامة الذي يميز أسلوب تواصله الأوسع.
المراجع
- الموقع الشخصي — sleepinyourhat.github.io
- المدونة
- الأسئلة الشائعة
- قائمة المنشورات
- X / Twitter — @sleepinyourhat
- GitHub — @sleepinyourhat
- ملف Digg
- Google Scholar
- ملف NYU CDS
- “القائمة المرجعية” (سبتمبر 2024)
- “لماذا أعتقد أن المزيد من باحثي معالجة اللغات الطبيعية يجب أن ينخرطوا في مخاوف سلامة الذكاء الاصطناعي” (أكتوبر 2022)
- “وضع الحواجز الواقية” (أبريل 2025)
- قياس التقدم في الإشراف القابل للتوسع — arXiv:2211.03540
- اكتشاف سلوكيات النماذج اللغوية باستخدام التقييمات المكتوبة بواسطة النماذج — arXiv:2212.09251