سوزان تشانغ

مهندسة أبحاث صينية أمريكية قامت ببناء أحد أكبر أنظمة التعلم المعزز في OpenAI للعبة Dota 2، وقادت بشكل مشترك البنية التحتية للتدريب والإصدار المفتوح لـ OPT-175B في Meta AI، وشاركت في تأليف LIMA — الورقة البحثية التي أظهرت أن المواءمة لا تتطلب مجموعات بيانات ضخمة مُوسومة.


ملف شخصي

الجنسية أمريكية (صينية أمريكية)
المؤسسات الحالية Google DeepMind (مهندسة أبحاث رئيسية)
مجالات البحث أنظمة التعلم الآلي واسعة النطاق، البنية التحتية لتدريب نماذج اللغات الكبيرة، التعلم المعزز على نطاق واسع، المواءمة، نماذج اللغات متعددة الوسائط
التعليم بكالوريوس في الرياضيات، جامعة برينستون
الموقع الإلكتروني suchenzang.github.io
X / تويتر @suchenzang
GitHub suchenzang
Google Scholar Susan Zhang

نظرة عامة

سوزان تشانغ هي مهندسة أبحاث صينية أمريكية ومتخصصة في الأنظمة الموزعة، وتشغل حاليًا منصب مهندسة أبحاث رئيسية في Google DeepMind في منطقة خليج سان فرانسيسكو. اشتهرت بمشروعين بارزين: بناء أحد أكبر أنظمة التدريب على التعلم المعزز التي تم نشرها على الإطلاق، والذي شغّل OpenAI Five — الوكيل الذي هزم فرق Dota 2 المحترفة — وقيادة تطوير وإصدار مفتوح المصدر لنموذج OPT-175B في Meta AI، وهو أول نموذج لغوي يحتوي على 175 مليار معلمة تم إصداره مع الأوزان الكاملة وكود التدريب وسجل تشغيلي من 114 صفحة. شكل إصدار OPT سابقة في الصناعة من حيث الشفافية في تطوير نماذج اللغات الكبيرة وأثر بشكل مباشر على جهود نماذج اللغات الكبيرة مفتوحة المصدر اللاحقة. شاركت أيضًا في تأليف ورقة LIMA (الأقل هو الأكثر للمواءمة)، والتي أظهرت أن 1000 مثال تم اختيارها بعناية يمكن أن تحقق جودة مواءمة تنافسية مع النماذج المدربة على كميات أكبر بكثير من البيانات. وصفها الذاتي —