Percy Liang

ref · 5월 25, 2026, 7:30오전

스탠퍼드 대학교 컴퓨터과학과 부교수, CRFM 창립 이사, "기초 모델(foundation models)"이라는 용어를 만든 연구자, SQuAD와 HELM의 공동 창시자, 그리고 기초 모델 훈련 과정을 공개적으로 재구축하는 오픈 사이언스 이니셔티브인 Marin의 창시자.

프로필

분야	세부 내용
국적	미국
현 소속 기관	스탠퍼드 대학교 — 컴퓨터과학과 (겸임: 통계학과)
기타 역할	스탠퍼드 기초 모델 연구 센터(CRFM) 소장; Together AI 공동 창업자; Simile AI 공동 창업자; Marin 창시자
연구 분야	기초 모델, 자연어 처리, 의미 분석, 기계 학습 이론, 강건성, 평가, 재현성
박사 지도교수	Michael I. Jordan; Dan Klein
박사 학위 논문	전산 언어학 / 확률적 모델 (UC 버클리, 2011)
학술 웹사이트	cs.stanford.edu/~pliang
Marin	marin.community
X / 트위터	@percyliang
GitHub	@percyliang
Google Scholar	scholar.google.com

개요

Percy Liang은 미국의 컴퓨터과학자이자 스탠퍼드 대학교 컴퓨터과학과 부교수로, 기초 모델 연구 센터(CRFM)의 창립 이사입니다. 그는 2021년 CRFM의 획기적인 논문을 통해 '기초 모델(foundation models)'이라는 용어를 만들었습니다. 이 논문은 백 명이 넘는 스탠퍼드 연구자들이 대규모 사전 훈련 모델의 기회와 위험을 매핑하기 위해 모인 것이었습니다. 그 이후로 그는 이 분야의 주요 평가 프레임워크(HELM)를 구축하고, NLP에서 가장 영향력 있는 벤치마크 중 하나(SQuAD)를 공동 창작했으며, 원시 데이터부터 결과까지 완전한 프로그램적 출처를 갖춘 기초 모델을 훈련하고 공유하는 개방형 연구소 Marin을 시작했습니다. 그는 오픈 모델을 위한 추론 및 연구 플랫폼인 Together AI와 Simile AI를 공동 창업했습니다. 기술적, 제도적 기여 외에도 Liang은 뛰어난 생산성을 자랑하는 연구실을 이끌었습니다. 그의 동문 명단은 현재 최고의 ML 교수진과 연구 과학자 세대의 명단을 그대로 옮겨놓은 듯하며, 졸업생들은 버클리, 프린스턴, CMU, NYU, USC, 워싱턴, 시카고 대학, 컬럼비아 대학, ETH 취리히에서 정교수 자리를 맡고 있습니다. 그는 자신의 연구 방향을 간단히 설명합니다. „저는 단순한 것에 이끌리고, 사물을 깊이 이해하고 싶어 하며, 유용한 시스템을 구축하는 것을 좋아합니다.“

초기 생애 및 교육

Liang은 어린 시절 프로그래밍과 수학에서 거둔 경쟁적 기록이 이 위키 시리즈에서 가장 화려한 편에 속합니다. 그는 2000년 국제 정보 올림피아드(IOI)에서 은메달을 획득했고, 2002년 ACM ICPC World Finals에서 그의 팀은 2위를 차지했습니다. 이는 가장 경쟁이 치열한 국제 프로그래밍 대회 중 두 개입니다. 그는 또한 2000년 피닉스 청소년 음악 콩쿠르 피아노 부문에서 우승하여, 경쟁 프로그래머이자 진지한 음악가라는 이중 정체성을 일찍부터 확립했으며, 이는 그의 경력 내내 지속되었습니다. 이후 그는 KDFC 클래식 스타 서치 대회(21세 이상 부문, 2008)와 MIT 협주곡 콩쿠르(2004)에서도 우승했습니다.

B.S., 컴퓨터과학 — MIT, 2004
Liang은 MIT에서 학사 학위를 마쳤습니다.

M.Eng., 컴퓨터과학 — MIT, 2005
그의 석사 논문은 통계적 NLP의 선도 연구자인 Michael Collins의 지도를 받았습니다.

Ph.D., 컴퓨터과학 — UC 버클리, 2011
Liang의 박사 연구는 Michael I. Jordan(2000~2010년대 대부분 기간 동안 머신러닝에서 가장 많이 인용된 연구자)과 Dan Klein(선도적인 전산 언어학자이자 구문 분석 연구자)의 공동 지도를 받았습니다. 그의 논문 연구는 통계적 학습 이론과 구조적 예측을 결합한 자연어 처리를 위한 확률적 모델에 초점을 맞추었으며, 이는 이후 의미 분석 및 언어 접지(grounding) 연구의 기초가 되었습니다.

포스트닥, Google — 2012
박사 학위를 마친 후 Liang은 스탠퍼드에 합류하기 전에 Google에서 짧은 포스트닥 과정을 밟았습니다.

경력

스탠퍼드 대학교 — 부교수 (2012–현재)

Liang은 스탠퍼드에 조교수로 합류하여 부교수로 승진했습니다. 그는 컴퓨터과학과 통계학과에 겸임 교수로 재직 중이며, 스탠퍼드 HAI, SAIL, NLP 및 ML 그룹에 소속되어 있습니다.

의미 분석 및 접지 (2012–2018)
Liang의 초기 스탠퍼드 연구는 의미 분석(semantic parsing)에 초점을 맞추었습니다. 이는 기계가 자연어를 구조화된 데이터베이스나 환경에 대해 실행 가능한 형식 프로그램으로 번역하도록 가르치는 것입니다. 그의 그룹은 원격 잡음 지도(distant, noisy supervision)로부터 의미 분석기를 학습하는 방법(논리적 형식에 주석을 다는 대신 프로그램을 실행)과 구성적 일반화를 위한 방법을 개발했습니다. 이 연구는 ACL, EMNLP, ICML에서 여러 높은 인용 횟수를 기록한 논문을 생산했으며 그의 첫 번째 박사 과정 학생들을 훈련시켰습니다.

SQuAD — 스탠퍼드 질의응답 데이터셋 (2016)
Liang은 박사 과정 학생 Pranav Rajpurkar 등과 함께 SQuAD를 공동 창작했습니다. SQuAD는 위키피디아 구절을 기반으로 구축된 독해 이해 벤치마크입니다. 원래 SQuAD 데이터셋(2016)과 적대적 확장판인 SQuAD 2.0(2018, Robin Jia와 함께)은 NLP 역사상 가장 많이 사용된 벤치마크 중 하나가 되었습니다. 2016년 논문은 수만 회 인용을 축적하여 이 분야에서 가장 많이 인용된 논문 중 하나가 되었습니다. SQuAD의 규모, 형식, 명확한 평가 프로토콜의 조합은 이후 NLP 벤치마크의 템플릿을 확립했으며 기계 독해 이해 연구의 물결을 촉발했습니다.

독해 이해를 위한 적대적 예제 (2017)
Robin Jia와 함께 Liang은 SQuAD 구절에 주의를 분산시키는 문장을 추가하면 모델 성능이 극적으로 떨어진다는 것을 보여주었습니다. 이 발견은 NLP에서 강건성과 분포 변화에 대한 이후 분야 전반의 집중을 예고하고 구성하는 데 도움이 되었습니다.

머신러닝을 위한 영향 함수 (2017)
Pang Wei Koh와 공동 저술(이후 확장)한 이 연구는 고전적인 통계적 영향 함수를 신경망에 적용하여 주어진 예측에 가장 큰 영향을 미치는 훈련 예제를 식별했습니다. 이는 데이터 속성, 모델 디버깅, 훈련 동역학 이해를 위한 기초 도구입니다.

CodaLab 워크시트
Liang은 재현 가능한 연구를 위한 초기이자 지속적인 옹호자였으며, CodaLab 워크시트를 개발하고 유지 관리하고 있습니다. 이 플랫폼은 완전한 출처를 추적하여 계산 실험을 관리할 수 있게 해주며, 결과를 재현하는 데 필요한 모든 코드와 데이터가 출판물에 직접 연결되어 논문을 '실행 가능’하게 만듭니다.

CS336: 처음부터 언어 모델 만들기
Liang은 스탠퍼드의 과정인 CS336을 만들었습니다. 이 과정은 데이터, 아키텍처, 훈련, 평가를 실제 언어 모델 개발 규모에서 처음부터 다루며, 학생들이 모든 구성 요소를 스스로 구현하도록 요구한다는 점에서 독특하며, 대학원 수준의 언어 모델 교육이 어떠해야 하는지에 대한 표준을 확립하는 데 영향력을 미쳤습니다.

CS324 / CS221 / CS229T
Liang은 또한 CS324(기초 모델의 발전), CS221(인공지능), CS229T(통계적 학습 이론)를 가르치며, AI의 최첨단 응용 및 이론적 측면을 모두 다룹니다.

‘기초 모델’ 용어 창안 및 CRFM 설립 (2021)

2021년 8월, Liang은 스탠퍼드 HAI 내의 이니셔티브로 스탠퍼드 기초 모델 연구 센터(CRFM)를 설립하고, 획기적인 보고서 "On the Opportunities and Risks of Foundation Models"를 공동 주도했습니다. 이는 백 명이 넘는 스탠퍼드 연구자들이 참여하여 대규모 사전 훈련 모델의 기술적, 사회적, 법적, 윤리적 차원을 다룬 200페이지 분량의 분석입니다. 이 논문은 방대한 범위의 데이터로 훈련되어 다양한 작업에 적용 가능한 모델을 설명하기 위해 '기초 모델(foundation models)'이라는 용어를 만들었습니다. Liang은 나중에 명명 이유를 설명했습니다. 그와 동료들은 „스탠퍼드 대학교를 돌아다니며 누가 이 현상에 관심이 있는지 보았고“, 어느 쪽으로도 평가적인 함의가 없으면서도 설명적인 용어가 필요했습니다.

이 용어는 빠르게 전 세계적으로 채택되어 산업, 정부, 학계 담론 전반에서 이전 용어(„대규모 언어 모델“, „사전 훈련 모델“, „기본 모델“)를 대체하거나 경쟁하게 되었습니다. CRFM 보고서는 2021년 가장 많이 인용된 AI 논문 중 하나가 되었으며, 미국, EU, 영국의 AI 정책 논의의 프레임을 형성하는 데 기여했습니다.

HELM — 언어 모델의 총체적 평가 (2022)

CRFM 동료들과 함께 Liang은 HELM(Holistic Evaluation of Language Models)을 개발했습니다. 이는 세 가지 원칙에 기반한 벤치마킹 프레임워크입니다: 임시 목록이 아닌 평가 시나리오의 체계적인 분류, 공정한 모델 간 비교를 위한 모든 시나리오에 대한 모든 모델 평가, 정확도를 넘어선 여러 지표(보정, 강건성, 공정성, 효율성 포함) 측정. 초기 릴리스는 AI21, Anthropic, Cohere, Google, Meta, Microsoft, NVIDIA, OpenAI 등 13개 조직의 30개 이상의 모델을 평가했으며, 이는 그 시점까지 언어 모델에 대한 가장 포괄적인 공개 비교 평가였습니다. HELM은 이후 시각-언어 모델, 코드, 추론 벤치마크를 포함하도록 확장되었으며, crfm.stanford.edu/helm에서 지속적으로 업데이트되는 공개 리소스로 호스팅되고 있습니다.

생성 에이전트 (2023)

Liang은 박사 과정 학생인 Joon Sung Park 및 Michael Bernstein과 함께 "Generative Agents: Interactive Simulacra of Human Behavior"를 공동 저술했습니다. 이 논문은 가상 마을에 내장된 LLM 기반 에이전트가 그럴듯하고 창발적인 사회적 행동(기억 형성, 계획 수립, 정보 확산, 이벤트 조직)을 보일 수 있음을 보여주었습니다. 2023년 가장 많이 인용된 NLP 논문 중 하나인 이 연구는 ‘LLM 사회 시뮬레이션’ 연구 장르를 확립했으며 AI 연구 및 게임 디자인 커뮤니티 모두에 영향을 미쳤습니다.

Prefix Tuning (2021)

Liang은 Xiang Lisa Li와 함께 Prefix Tuning을 공동 저술했습니다. 이는 모든 모델 가중치를 업데이트하는 대신 입력 컨텍스트 앞에 훈련 가능한 연속 임베딩을 추가하여 언어 모델을 매개변수 효율적으로 미세 조정하는 방법으로, 적은 매개변수 업데이트로 전체 미세 조정에 필적하는 결과를 달성했습니다.

Together AI — 공동 창업자 (2022)

Liang은 Together AI(together.ai)를 공동 창업했습니다. 이 플랫폼은 오픈소스 언어 모델을 위한 추론 API와 연구 인프라를 제공하며, LLaMA 변종 및 맞춤 훈련 모델을 경쟁력 있는 비용으로 사용할 수 있게 합니다. Together AI는 대규모 오픈 모델에 대한 액세스가 필요한 ML 연구 커뮤니티의 많은 부분에서 사용되었습니다.

Simile AI — 공동 창업자

Liang은 Simile AI(simile.ai)를 공동 창업했습니다. 이는 비교적 최근의 벤처로, 생성 에이전트 및 AI-for-science 연구 방향을 기반으로 합니다.

Marin — 오픈 사이언스 기초 모델 연구소 (2025–현재)

2025년 5월, Liang은 Marin(marin.community)을 시작했습니다. 이는 처음부터 기초 모델을 훈련하고 모든 단계를 완전히 공개하는 오픈 연구소입니다. 코드, 데이터, 실험, 실수, 결과는 모두 GitHub 이슈(실험 사전 등록용), 풀 리퀘스트(코드용), Weights & Biases 보고서(결과용)를 통해 실시간으로 공유됩니다. Marin-8B-Base는 14/19 표준 벤치마크에서 LLaMA 3.1 8B를 이겼고, Marin-32B-Base는 2025년 10월 기준 동일한 벤치마크 세트에서 최고의 오픈소스 모델이 되었습니다. Marin의 speedrun 리더보드 대회는 연구자들이 주어진 계산 예산 내에서 더 빠른 훈련 방법을 찾도록 초대합니다. 이는 nanogpt speedrun에서 영감을 받았으며, 최고 성능자에게는 무료 컴퓨팅이 제공됩니다. 이 프로젝트는 Google TPU Research Cloud 리소스에서 실행되며 명시적으로 커뮤니티 연구 노력으로 구성됩니다.

주요 기여

‘기초 모델’ 용어 창안 — 2021년 CRFM 논문이 용어를 소개하고 정의했습니다. 이는 대규모 사전 훈련된 적응 가능한 모델을 설명하는 AI 연구, 정책, 산업 전반의 지배적인 어휘이 되었습니다.
SQuAD / SQuAD 2.0 — 스탠퍼드 질의응답 데이터셋(2016)과 그 적대적 확장판(2018)을 공동 창작했습니다. NLP 역사상 가장 많이 인용된 논문 중 하나입니다. 기계 독해 이해를 하위 분야로 형성하고 NLP에서 벤치마크 작업의 물결을 주도했습니다.
HELM — 수십 개의 모델과 수백 개의 시나리오에 걸쳐 평가된 가장 포괄적인 언어 모델 비교 평가 프레임워크를 구축했습니다. 투명성과 다차원 평가를 책임 있는 모델 비교의 표준으로 확립했습니다.
생성 에이전트 — LLM 기반 가상 사회에서 창발적인 사회적 행동을 시연했습니다. 2023년 가장 많이 인용된 AI 논문 중 하나이며 AI 시뮬레이션의 새로운 연구 방향을 정의했습니다.
Prefix Tuning — 전체 미세 조정 없이 대규모 언어 모델을 적응시키는 데 널리 사용되는 기술이 된 매개변수 효율적인 미세 조정 방법입니다.
ML을 위한 영향 함수 — 모델 예측을 훈련 데이터에 귀속시키는 기초 작업입니다. 모델 행동 이해 및 데이터 디버깅에 널리 사용됩니다.
Marin — 오픈 AI 과학을 위한 새로운 모델: 완전한 프로그램적 문서와 함께 공개적으로 기초 모델을 훈련하며, 과학 자체를 발표된 결과의 연속이 아닌 커뮤니티 과정으로 취급합니다.
적대적 SQuAD — 독해 이해 구절에 방해 요소를 추가하면 치명적인 모델 오류가 발생함을 보여주었습니다. 자연스러운 분포 변화 하에서 NLP 시스템의 취약성에 대한 가장 초기의 시연 중 하나입니다.
CodaLab 워크시트 — 재현 가능한 ML 실험을 위한 오픈 플랫폼입니다. Liang의 연구 인프라에 대한 지속적인 제도적 투자를 반영합니다.
CRFM — 스탠퍼드 기초 모델 연구 센터를 설립하고 이끌고 있으며, AI에 관한 영향력 있는 연구, 평가 프레임워크, 정책 참여를 생산해 왔습니다.

수상 및 인정

대통령 조기 경력 과학자 및 엔지니어 상 (PECASE) (2019)
IJCAI Computers and Thought Award (2016) — 만 35세 미만 연구자의 뛰어난 AI 기여에 대한 격년 상; 가장 권위 있는 초기 경력 AI 상 중 하나.
NSF CAREER Award (2016)
Sloan Research Fellowship (2015)
Microsoft Research Faculty Fellowship (2014)
AI2050 Schmidt Sciences Fellow (진행 중) — 고영향 AI 연구를 위한 펠로우십.
ACM ICPC World Finals — 2위 (2002) — MIT 팀과 함께.
국제 정보 올림피아드 — 은메달 (2000)
논문 수상 다수 (ACL, EMNLP, ICML, COLT, ISMIR, CHI, UIST, R 등).
대학원 펠로우십: NSF, NDSEG, GAANN, Siebel Scholar.
피아노: KDFC 클래식 스타 서치 우승(21세 이상 부문, 2008); MIT 협주곡 콩쿠르(2004); 피닉스 청소년 음악 콩쿠르(2000).

학문적 계보

Liang은 비정상적으로 많고 좋은 위치에 있는 박사 과정 학생 및 포스트닥 그룹을 지도했습니다. 가장 저명한 동문 중 일부는 다음과 같습니다.

Jacob Steinhardt — 박사 2018; 현재 UC 버클리 부교수이자 Transluce 창립자; 강건성, AI 안전, 평가 분야의 선도 연구자.
Pranav Rajpurkar — 박사 2021 (Andrew Ng와 공동 지도); 현재 하버드 부교수; SQuAD를 만들고 AI-for-medicine 연구를 주도.
Aditi Raghunathan — 박사 2021; 현재 CMU 조교수; 강건한 ML 분야의 선도 연구자.
Pang Wei Koh — 박사 2022; 현재 워싱턴 대학교 조교수; 영향 함수 및 분포 변화에 대한 영향력 있는 연구.
Rishi Bommasani — 박사 2025 (Dan Jurafsky와 공동 지도); "On the Opportunities and Risks of Foundation Models" 논문을 저술하고 HELM의 많은 부분을 주도; 현재 스탠퍼드 HAI 선임 연구원.
Joon Sung Park — 박사 2025 (Michael Bernstein과 공동 지도); Generative Agents의 첫 번째 저자; 현재 스타트업 창업자.
Tatsunori Hashimoto — 포스트닥; 현재 스탠퍼드 조교수; 여러 Liang 학생을 공동 지도.
Robin Jia — 박사 2020; 현재 USC 조교수; Adversarial SQuAD를 만듦.
Mina Lee — 박사 2023; 현재 시카고 대학교 조교수.
Yuhuai (Tony) Wu — 포스트닥; xAI(Elon Musk의 AI 회사) 공동 창업자.

주요 관계

Michael I. Jordan — 버클리에서 박사 지도교수; 그의 세대에서 가장 영향력 있는 ML 연구자 중 한 명; 통계적 엄격함과 원칙적인 불확실성 정량화에 대한 Jordan의 강조는 Liang의 연구 경력 전반에 걸쳐 나타납니다.
Dan Klein — 박사 공동 지도교수; 선도적인 전산 언어학자; Liang의 NLP 및 구조적 예측에 대한 기초를 형성.
Michael Collins — MIT에서 공학석사 지도교수; 통계적 NLP의 선구자 중 한 명; Liang의 언어 접근 방식에 가장 초기의 영향.
Fei-Fei Li — 스탠퍼드 HAI 공동 창립자이자 가까운 동료; 스탠퍼드 HAI 및 CRFM에서의 그들의 제도적 작업은 기초 모델의 거버넌스 및 평가에서 상당히 중첩됩니다.
Christopher Manning — 선임 스탠퍼드 NLP 동료; 여러 Liang 학생이 Manning과 공동 지도됨; 스탠퍼드 NLP 생태계 내에서 그들의 공동 위치는 그들의 관계에 특별한 제도적 무게를 부여합니다.
Chelsea Finn — 현재 스탠퍼드 동료; Liang은 Finn과 학생을 공동 지도하여 그의 언어 모델링 작업과 그녀의 로봇공학 관점 사이의 중첩을 반영합니다.

개인적 스타일

Liang의 연구 및 제도적 작업은 명확성, 엄격함, 공공 책임성을 향한 일관된 지향성을 공유합니다. 그가 자신의 연구 정신을 설명하는 데 사용하는 문구 — „저는 단순한 것에 이끌리고, 사물을 깊이 이해하고 싶어 하며, 유용한 시스템을 구축하는 것을 좋아합니다“ — 는 교육(CS336은 학생들이 처음부터 모든 것을 구현하도록 요구함), 평가(HELM은 선택적이기보다는 철저하고 원칙적이려고 함), 오픈 사이언스(Marin은 실수를 포함한 모든 실험을 문서화함)에 대한 그의 접근 방식에 동등하게 적용됩니다. CodaLab, HELM, Marin에 대한 그의 지속적인 투자는 과학의 누적적 신뢰성이 도달한 결론뿐만 아니라 작업이 기록되고 공유되는 방식에 달려 있다는 확신을 반영합니다. 그의 교수 직위와 함께 Together AI와 Simile AI를 공동 창업한 것은 연구 결과물에 자신을 제한하지 않고 기관과 플랫폼을 구축하는 그의 경력 패턴을 나타냅니다. 그는 Marin 뒤에 있는 오픈 사이언스 원칙을 대규모 AI 연구에서 그가 보는 재현성 위기에 대한 직접적인 대응으로 설명했습니다. 즉, 최첨단 모델을 훈련하는 실험이 실시간으로 문서화되지 않으면 이 분야는 자체 작업 위에 누적적으로 구축하는 능력을 상실합니다.