Jeff Dean

미국의 컴퓨터 과학자이자 Google 시니어 펠로우(Senior Fellow)입니다. Google의 분산 시스템 인프라 및 머신러닝 플랫폼의 수석 설계자이며, 현재 Google DeepMind의 최고 과학자(Chief Scientist)입니다.


기본 정보

항목 내용
전체 이름 제프리 애드게이트 딘 (Jeffrey Adgate Dean)
출생 1968년 7월 23일, 미국 하와이주 호놀룰루
국적 미국
현 소속 기관 Google DeepMind
현 직함 최고 과학자 (Chief Scientist)
연구 분야 분산 시스템, 대규모 머신러닝, 딥러닝, 컴퓨터 시스템, 헬스케어용 ML
박사 지도교수 크레이그 체임버스 (Craig Chambers)
박사 논문 Whole-Program Optimization of Object-Oriented Languages (워싱턴 대학교, 1996)
Google 연구 페이지 research.google/people/jeff
X / Twitter @JeffDean
Google Scholar scholar.google.com/citations?user=NMS69lQAAAAJ

개요

제프 딘(Jeff Dean)은 1999년 중반 Google의 30번째 직원으로 합류한 이후, 25년간 현대 인터넷 인프라를 구축하는 데 기여한 미국의 컴퓨터 과학자입니다. 오랜 공동 연구자였던 산제이 게마와트(Sanjay Ghemawat)와 함께 그는 MapReduce, Bigtable, Spanner, Protocol Buffers와 같은 핵심 분산 시스템을 설계하고 구축했습니다. 이 시스템들은 대규모 데이터 처리의 아키텍처를 정의했으며, Apache Hadoop을 포함한 차세대 오픈소스 프로젝트에 영감을 주었습니다. 2011년부터는 머신러닝 분야로 방향을 전환하여 Google Brain을 공동 창립하고, DistBelief, TensorFlow, Pathways 등 세 세대에 걸친 ML 훈련 인프라를 개발하는 한편, word2vec, 지식 증류(Knowledge Distillation), 희소 전문가 혼합(Mixture-of-Experts) 아키텍처 등의 영향력 있는 연구를 주도했습니다. 딘과 게마와트는 Google에서 시니어 펠로우(Senior Fellow)라는 회사 최고 기술 직위를 받은 유일한 두 명입니다. 2023년 Google Brain과 DeepMind가 Google DeepMind로 합병된 이후, 그는 최고 과학자(Chief Scientist)로 재직하며 연구 및 제품 AI 활동 전반에 걸쳐 일하고 있습니다.


초기 생애 및 교육

어린 시절과 자주 이사한 성장 과정

딘은 1968년 7월 23일 하와이주 호놀룰루에서 태어났습니다. 그의 아버지는 열대병 연구자였고 어머니는 의학 인류학자였습니다. 그의 가족은 그의 어린 시절 내내 하와이, 필리핀, 우간다, 소말리아, 스위스 및 여러 미국 도시를 거주지로 삼아 자주 이사했습니다. 5학년부터 10학년까지는 미네소타주 미니애폴리스-세인트폴 지역의 학교를 다녔으며, 이후 학부 교육을 위해 그곳으로 다시 돌아왔습니다. 고등학교 때와 대학 방학 동안 그는 처음에는 미국 질병통제예방센터(CDC), 이후에는 세계보건기구(WHO)를 위한 역학 소프트웨어인 Epi Info를 작성했는데, 이 프로젝트는 그의 가장 많이 인용된 업적 중 하나로 남아 있습니다.

미네소타 대학교 (1986–1990)

딘은 1990년 미네소타 대학교에서 컴퓨터 과학 및 경제학 학사 학위를 *최우등(summa cum laude)*으로 받았습니다. 비핀 쿠마르(Vipin Kumar)의 지도 아래 작성된 그의 우등 논문은 신경망 훈련의 병렬 구현을 탐구했으며, 이는 그의 경력이 결국 취하게 될 방향을 일찍이 보여주는 신호였습니다. 그는 1학년 때 미래의 아내인 하이디 호퍼(Heidi Hopper)를 만났으며, 두 사람 모두 1990년에 졸업했습니다.

세계보건기구 (1990–1991)

학부와 박사 과정 사이에 딘은 제네바에 있는 WHO의 글로벌 에이즈 프로그램(Global Programme on AIDS)에서 1년 동안 HIV/AIDS 팬데믹을 위한 통계 모델링 및 예측 소프트웨어를 개발했으며, 고등학교 때 시작한 Epi Info 코드베이스를 확장했습니다.

워싱턴 대학교 박사 과정 (1991–1996)

딘은 1996년 워싱턴 대학교에서 크레이그 체임버스의 지도 아래 컴퓨터 과학 박사 학위를 마쳤습니다. 그의 논문은 객체 지향 언어를 위한 컴파일러 최적화, 특히 Cecil 및 C++와 같은 언어를 위한 프로그램 전체 분석 및 선택적 특수화 기술을 다루었습니다. 이 연구는 PLDI 2005에서 10년 회고 가장 영향력 있는 논문상(Most Influential Paper award)을, 관련 프로파일링 연구로 SOSP 1997에서 최우수 논문상(Best Paper)을 받았습니다.


경력

DEC / Compaq Western Research Lab (1996–1999)

졸업 후 딘은 팔로알토에 있는 DEC의 Western Research Lab에 입사하여 오버헤드가 낮은 프로파일링 도구, 비순차적 프로세서를 위한 마이크로프로세서 아키텍처, 웹 기반 정보 검색에 대해 연구했습니다. 이 연구의 대부분은 산제이 게마와트와의 긴밀한 협력 아래 수행되었으며, 두 사람의 전문적인 파트너십이 시작되어 이후 두 사람의 경력을 정의하게 되었습니다. Compaq이 DEC를 인수한 후, 딘은 1999년 초에 잠시 비교 쇼핑 스타트업인 mySimon에 합류하여 분산 웹 크롤링 및 인덱싱 시스템을 설계한 후, 그해 말 Google로 떠났습니다.

Google — 인프라 엔지니어에서 시니어 펠로우까지 (1999–2011)

딘은 1999년 중반 Google의 30번째 직원으로 합류했습니다. 이후 12년 동안 그는 게마와트와 함께 Google 엔지니어링의 핵심을 재설계하여 문서 볼륨, 쿼리 로드, 업데이트 빈도에서 회사가 수 주문 규모로 성장할 수 있게 해주는 시스템을 제공했습니다. 그들의 주요 기여는 내부 분산 컴퓨팅 스택(MapReduce (OSDI 2004), Bigtable (OSDI 2006), Spanner (OSDI 2012), LevelDB (2011), Protocol Buffers)과 5세대에 걸친 크롤링, 인덱싱, 쿼리 서빙 시스템이었습니다. 그는 또한 초기 Google Ads 서빙 시스템의 설계 및 구현을 주도하고 Google Translate의 통계적 기계 번역 백엔드에 기여했습니다. 딘과 게마와트는 공동으로 Google 시니어 펠로우(회사 최고 기술 직위)로 임명되었는데, 이는 2025년 현재까지도 그들만이 유일하게 보유한 영예입니다.

Google Brain — 공동 창립자 및 리더 (2011–2018)

2011년, 딘은 새로 설립된 Google X 스컹크웍스(skunkworks)에 합류하여 심층 신경망을 연구했습니다. 이후 „고양이 뉴런 논문(cat neuron paper)“으로 알려진 초기 실험은 수백만 개의 YouTube 프레임에 대한 비지도 학습을 사용하여 얼굴 감지 뉴런을 자발적으로 개발한 네트워크를 훈련시켰습니다. 이는 사람이 레이블을 지정한 데이터 없이 대규모 심층 학습이 의미 있는 표현을 표면화할 수 있음을 보여주었습니다. 이 프로젝트는 Google Brain의 씨앗이 되었고, 딘은 2012년 Google Brain을 공동 창립하고 이끌기 시작했습니다. 그의 지휘 아래 팀은 심층 신뢰 네트워크를 위한 독점 분산 훈련 시스템인 DistBelief를 개발했습니다. 이 시스템은 당시 공개된 최첨단 모델이 1,000만~5,000만 개의 파라미터를 가졌을 때 20억 개의 파라미터를 가진 모델로 확장되었습니다. DistBelief는 이후 TensorFlow로 리팩터링되었으며, 딘은 이를 오픈소스화하는 데 앞장섰습니다. 2015년 11월에 출시된 TensorFlow는 수년간 가장 널리 채택된 딥러닝 프레임워크가 되었습니다. 이 기간 동안 Brain 연구는 또한 word2vec (NeurIPS 2013), 지식 증류 (2015), 전문가 혼합 계층(Mixture-of-Experts Layer) (ICLR 2017), Google의 신경 기계 번역 시스템 (2016)을 탄생시켰습니다.

Google AI — 책임자 (Head) (2018–2023)

2018년 4월, 존 지안난드레아(John Giannandrea)가 Apple로 떠난 후, 딘은 Google의 AI 부문 책임자로 임명되어 Google Brain, Google Research 및 이들과 DeepMind 및 제품 팀 간의 관계를 총괄하게 되었습니다. 이 자격으로 그는 Transformer 아키텍처, BERT, TPU 하드웨어, PaLM, Pathways ML 인프라 시스템에 대한 작업을 이끌었으며, 칩 설계를 위한 ML, 헬스케어를 위한 ML, 기후를 위한 ML 등의 분야에서 연구를 공동 저술했습니다. 이 기간은 AI 윤리 연구원인 팀니트 게브루(Timnit Gebru) (2020년 12월)와 마가렛 미첼(Margaret Mitchell) (2021년 2월)의 이목을 끄는 퇴사로 특징지어졌으며, 이러한 사건들은 상당한 언론의 주목을 받았고 딘은 반대 의견을 가진 연구를 처리하는 데 실패했음을 인정하는 내부 커뮤니케이션을 발행했습니다.

Google DeepMind — 최고 과학자 (2023–현재)

2023년 4월, Alphabet은 Google Brain과 DeepMind를 단일 부서인 Google DeepMind로 합병한다고 발표했으며, 데미스 허사비스(Demis Hassabis)가 이를 이끌게 되었습니다. 조직 개편의 일환으로 딘은 Google의 최고 과학자가 되어 Google DeepMind와 Google Research 전반에 걸친 AI 발전에 집중하게 되었습니다. 그는 „쌍둥이가 함께 오는 것처럼“이라는 의미로 Google의 멀티모달 플래그십 모델 제품군의 이름을 Gemini라고 지었습니다. 2025년에는 대학 연구실에서 AI 연구의 실용화를 가속화하는 데 초점을 맞춘 비영리 단체인 Laude Institute의 이사회에 합류했습니다. 그는 계속해서 출판하고 시스템 및 ML 연구 방향에 대해 자주 기조 강연을 하고 있으며, Perplexity, Sakana AI, Roboflow, World Labs를 포함한 AI 스타트업에 적극적으로 엔젤 투자하고 있습니다.


주요 기여

  • MapReduce (OSDI 2004, 산제이 게마와트 공저) — 상용 클러스터에서 대규모 데이터 세트를 처리하고 생성하기 위한 프로그래밍 모델을 도입하여 오류 처리 및 데이터 분할을 추상화했습니다. 이는 Apache Hadoop에 직접적인 영감을 주었고 업계 전반의 대규모 데이터 처리를 혁신했습니다. SIGOPS Hall of Fame Award 2015.
  • Bigtable (OSDI 2006, 게마와트, 페이 창(Fay Chang), 마이크 버로우즈(Mike Burrows) 등 공저) — 현재 피크 시 초당 60억 개 이상의 요청을 처리하고 1,000만 테라바이트 이상의 데이터를 관리하는 페타바이트 규모의 반정형 저장 시스템을 설계했습니다. NoSQL 운동에 영향을 미쳤으며 Cloud Bigtable로 외부에서 사용 가능합니다. SIGOPS Hall of Fame Award 2016.
  • Spanner (OSDI 2012, 게마와트 등 공저) — Paxos 및 지리적 데이터 센터를 초월한 고도로 동기화된 클록을 통해 강력한 일관성을 제공하는 전 세계적으로 분산된 관계형 데이터베이스입니다. OSDI 2012 최우수 논문상, SIGOPS Hall of Fame 2022, 2025 ACM SIGMOD Systems Award 수상.
  • Protocol Buffers — Google의 거의 모든 RPC 프로토콜에서 사용되는 언어 중립적 바이너리 직렬화 형식을 공동 설계했습니다. 오픈소스화되어 Google 외부에서도 널리 채택되었습니다.
  • LevelDB (2011, 게마와트 공저) — Bigtable의 SSTable 설계에서 파생된 오픈소스 키-값 저장소로, Google Chrome의 IndexedDB, Bitcoin Core, Minecraft Bedrock Edition에 내장되어 있습니다.
  • DistBelief — 당시 출판된 연구보다 수 주문 규모 더 큰 20억 개의 파라미터를 가진 모델을 가능하게 하는 독점 분산 훈련 시스템을 설계하고 구축했습니다. TensorFlow의 직접적인 전신입니다.
  • TensorFlow (2015, 오픈소스화) — Google의 ML 프레임워크 오픈소스화를 공동 설계하고 지지했습니다. 임베디드 장치에서 TPU 슈퍼컴퓨터에 이르는 플랫폼 전반에 걸쳐 수백만 명의 연구자와 개발자가 사용했습니다.
  • Pathways (MLSys 2022) — 대규모 이기종, 멀티태스크, 희소 신경망 훈련을 가능하게 하는 비동기 분산 데이터플로우 시스템을 공동 설계했습니다. PaLM 및 Gemini의 기반 인프라입니다.
  • word2vec (NeurIPS 2013, 토마스 미콜로프(Tomas Mikolov) 등 공저) — NLP의 초석이 된 분산 단어 표현을 도입한 두 편의 논문을 공동 저술했습니다. NeurIPS 2023 Test of Time Award.
  • 지식 증류(Knowledge Distillation) (2015, 제프리 힌턴(Geoffrey Hinton), 오리올 빈얄스(Oriol Vinyals) 공저) — 대규모 교사 네트워크에서 소규모 학생 모델로 지식을 전송하는 기술을 공동 창안했습니다. 현재 모델 압축 및 배포 파이프라인에서 보편적으로 사용됩니다.
  • 전문가 혼합 계층(Mixture-of-Experts Layer) (ICLR 2017) — 현재 최전선 모델에서 사용되는 것을 포함하여 현대 대규모 희소 아키텍처의 기반이 되는 희소 게이트 MoE 논문을 공동 저술했습니다.
  • „The Tail at Scale“ (Communications of the ACM, 2013, 루이스 안드레 바로소(Luiz André Barroso) 공저) — 대규모 서비스의 지연 시간 변동성을 분석하고 긴 꼬리 지연 시간을 제어하는 기술을 제안했습니다. SIGOPS Hall of Fame Award 2025.
  • TPU 아키텍처 옹호 — 프로덕션 딥러닝을 대규모로 수행하려면 맞춤형 실리콘이 필요하다는 점을 조기에 식별했습니다. TPUv1부터 Google의 Tensor Processing Unit 프로그램을 지지하여 추론 시 현대 CPU/GPU 대비 와트당 30~80배 더 나은 성능을 제공했습니다.
  • „The Great AI Awakening“ 기여 — 2016년 New York Times Magazine의 획기적인 특집 기사에서 다룬 신경 기계 번역 연구로, Google이 Translate에서 신경 방법으로 전환한 규모를 폭넓은 청중이 이해할 수 있게 했습니다.

수상 및 인정

  • ACM Prize in Computing (2012, 산제이 게마와트 공동 수상) — 확장 가능한 분산 시스템에 대한 근본적인 공헌을 인정받아 수상.
  • ACM SIGOPS Mark Weiser Award (2012) — 운영 체제 연구에 대한 공헌.
  • Fellow, Association for Computing Machinery (2009)
  • 미국 국가 공학 아카데미(National Academy of Engineering) 회원 (2009) — 미국 공학 분야의 최고 영예 중 하나.
  • 미국 예술 과학 아카데미(American Academy of Arts and Sciences) 회원 (2016)
  • 미국 과학 진흥 협회(American Association for the Advancement of Science) 회원 (날짜 미상)
  • IEEE 존 폰 노이만 메달(John von Neumann Medal) (2021) — 컴퓨터 과학 및 공학 분야에서 IEEE의 최고 영예.
  • NeurIPS Test of Time Award (2023) — word2vec 논문 „Distributed Representations of Words and Phrases and their Compositionality“ (NeurIPS 2013)에 대해 수상.
  • SIGOPS Hall of Fame Awards — MapReduce (2015), Bigtable (2016), Spanner (2022), „The Tail at Scale“ (2025)에 대해 수상.
  • ACM SIGMOD Systems Award (2025) — Spanner에 대해 수상.
  • TIME100 AI (2025) — Time 잡지의 AI 분야 가장 영향력 있는 인물 목록에 선정.

주요 관계

  • 산제이 게마와트(Sanjay Ghemawat) — 수십 년간의 엔지니어링 파트너. 두 사람은 MapReduce, Bigtable, Spanner, LevelDB, Protocol Buffers의 공동 저자이며, 유일한 두 명의 Google 시니어 펠로우입니다. The New Yorker는 2018년 „The Friendship That Made Google Huge“라는 제목으로 그들의 협업을 조명했습니다.
  • 크레이그 체임버스(Craig Chambers) — 워싱턴 대학교의 박사 지도교수. 객체 지향 언어를 위한 컴파일러 최적화에 관한 딘의 연구를 지도했습니다.
  • 비핀 쿠마르(Vipin Kumar) — 미네소타 대학교의 학부 우등 논문 지도교수. 딘의 초기 신경망 훈련 연구를 지도했습니다.
  • 제프리 힌턴(Geoffrey Hinton) — 지식 증류 논문 (2015)의 공동 저자. 힌턴의 심층 신뢰 네트워크 연구는 Google Brain 형성의 직접적인 지적 선구자였습니다.
  • 데미스 허사비스(Demis Hassabis) — Google DeepMind의 CEO이자 2023년 Google Brain과 DeepMind 합병에서 딘의 상대역. 두 사람은 현재 통합 조직을 공동으로 이끌고 있습니다.
  • 팀니트 게브루(Timnit Gebru) — Google Ethical AI 팀의 전 공동 책임자. 2020년 12월 그녀의 해고는 딘의 리더십 결정과 관련된 중요한 내부 및 공개 논란을 촉발했습니다.
  • 꾸옥 V. 레(Quoc V. Le) — Google Brain의 오랜 협력자. 고양이 뉴런 논문, word2vec, 신경 기계 번역 연구의 핵심 인물.
  • 데이비드 패터슨(David Patterson) — 컴퓨터 아키텍처의 선구자이자 TPU 및 ML 탄소 배출량 관련 연구의 협력자. 딘과 함께 Laude Institute 이사회에서 활동하고 있습니다.

개인적 스타일

딘은 업계 내에서 40년에 걸친 경력 동안 컴파일러 이론, 분산 시스템, 딥러닝 연구를 편안하게 넘나드는 탁월하게 폭넓은 기술적 범위와 실행 가능한 규모의 최외곽에서 작동하는 시스템에 대한 지속적인 선호로 특징지어집니다. 그의 기술 저술 및 강연은 정량적 프레이밍을 선호합니다. 그는 질적 평가보다는 구체적인 처리량, 지연 시간 및 탄소 배출 데이터를 게시하는 것으로 알려져 있으며, ML의 환경 비용에 대한 잘못된 정보라고 생각하는 것에 대해 공개적으로 이의를 제기해 왔습니다. 연구 프로필 외에도 그는 엔지니어들 사이에서 다른 사람들은 다루기 어렵다고 생각하는 문제를 해결하는 그의 진정한 명성을 반영하는, 그의 프로그래밍 능력에 대한 과장된 주장의 척 노리스(Chuck Norris) 스타일 장르인 인터넷 밈 „Jeff Dean Facts“의 주제이기도 합니다. 그의 개인 웹사이트와 강연은 그가 분야와 지역을 넘나들며 활동하는 데 부분적으로 도움이 되었다고 인정하는 유난히 자주 이사한 어린 시절 배경을 보여줍니다.


참고 문헌