Thomas G. Dietterich

Professor Emérito Distinto na Oregon State University e um dos arquitetos fundadores da área de aprendizado de máquina, cujas contribuições abrangem códigos de saída com correção de erros, aprendizado de instância múltipla, aprendizado por reforço hierárquico e sustentabilidade computacional.


Perfil

Nascimento 1954, South Weymouth, Massachusetts
Nacionalidade Americano
Instituição(ões) atual(is) Oregon State University — School of EECS (Professor Emérito Distinto); BigML (Cientista-Chefe)
Áreas de Pesquisa Aprendizado de Máquina, Métodos Ensemble, Aprendizado por Reforço Hierárquico, Aprendizado de Instância Múltipla, Sustentabilidade Computacional, Segurança de IA
Orientador de Doutorado Bruce G. Buchanan
Tese de Doutorado Constraint-Propagation Techniques for Theory-Driven Data Interpretation (Stanford University, 1984)
X / Twitter @tdietterich
GitHub tdietterich
Google Scholar Thomas G. Dietterich — 33.000+ citações

Visão Geral

Thomas G. Dietterich é um dos membros da geração fundadora de pesquisadores de aprendizado de máquina, tendo passado a maior parte de sua carreira — de 1985 até a aposentadoria em 2016 — construindo o programa de IA da Oregon State University enquanto produzia uma série de contribuições tecnicamente duradouras que permanecem como referências padrão. Ele é mais conhecido por introduzir códigos de saída com correção de erros (ECOC) como um método geral para classificação multiclasse, formalizar o problema de aprendizado de instância múltipla (MIL) e desenvolver o framework de decomposição MAXQ para aprendizado por reforço hierárquico. Institucionalmente, atuou como presidente fundador da International Machine Learning Society, editor executivo do periódico Machine Learning por seis anos, co-fundador do Journal of Machine Learning Research, presidente da AAAI de 2014 a 2016 e presidente de programa tanto da AAAI-90 quanto do NeurIPS 2000. Ele atraiu mais de 30 milhões de dólares em bolsas de pesquisa e formou uma linhagem de alunos que povoam grupos de pesquisa em IA em todo o mundo. Desde que se afastou do ensino ativo, permaneceu engajado publicamente como moderador da categoria arXiv cs.LG e como comentarista sobre riscos da IA — argumentando consistentemente por uma abordagem pragmática, focada em erros e falhas, do perigo da IA, em vez de cenários de superinteligência de ficção científica.


Início da Vida e Educação

Dietterich nasceu em 1954 em South Weymouth, Massachusetts. Sua família se mudou para Nova Jersey e depois para Illinois, onde se formou na Naperville Central High School. Ele se matriculou no Oberlin College, graduando-se com honras em Matemática — com especialização em probabilidade e estatística — em 1977, sendo eleito para a Phi Beta Kappa e recebendo uma Bolsa Nacional de Mérito ao longo do caminho. Ele passou dois anos na Universidade de Illinois em Urbana-Champaign e depois ingressou no programa de doutorado em Ciência da Computação na Universidade de Stanford. Sua pesquisa de doutorado, supervisionada por Bruce G. Buchanan no Heuristic Programming Project, abordou métodos de propagação de restrições para interpretação orientada por teoria de dados científicos — um exercício inicial em combinar conhecimento de domínio com inferência indutiva. Ele recebeu seu doutorado em 1984, no mesmo ano em que foi nomeado professor assistente na Oregon State University. Durante seus anos em Stanford, ele também ocupou um cargo de verão nos Bell Telephone Laboratories (1979) trabalhando em transferência de arquivos entre computadores para sistemas de comutação.


Carreira

Oregon State University — School of EECS (1985–2016; Emérito 2016–presente)

Dietterich ingressou no Departamento de Ciência da Computação da OSU em 1985 como professor assistente, foi promovido a professor associado em 1988 e a professor titular em 1995. Em 2005, foi nomeado Diretor de Pesquisa em Sistemas Inteligentes e, em 2013, designado Professor Distinto — a mais alta honraria acadêmica da universidade — em reconhecimento à sua posição como um dos cientistas mais citados em sua área. Aposentou-se da cátedra ativa em 2016 e detém o status de emérito. Ao longo de três décadas na OSU, construiu um grupo de pesquisa que trabalhou em toda a amplitude do aprendizado de máquina, desde a teoria fundamental até a informática ecológica, atraiu mais de 30 milhões de dólares em financiamento externo e supervisionou um grupo substancial de alunos de doutorado. Ele não está mais aceitando novos alunos ou pós-doutorandos.

Arris Pharmaceutical Corporation (1991–1993)

Durante uma licença da OSU, Dietterich atuou como Cientista Sênior na Arris Pharmaceutical em South San Francisco. O trabalho de design de fármacos desse período — no qual as moléculas tinham múltiplas conformações alternativas de baixa energia, mas apenas algumas eram farmacologicamente ativas — motivou diretamente a formalização do aprendizado de instância múltipla.

MyStrands, Inc. (2004–2005); Smart Desktop, Inc. (2006–2008)

Dietterich foi co-fundador ou atuou como cientista-chefe em duas startups iniciais adjacentes à IA: MyStrands, uma empresa de recomendação musical sediada em Corvallis que posteriormente levantou 24 milhões de dólares, e Smart Desktop, uma empresa sediada em Seattle adquirida logo após sua spin-off da OSU. Esses engajamentos refletiram seu interesse de longa data em sistemas de ML implantados, em vez de pesquisa puramente acadêmica.

BigML (2011–presente)

Desde 2011, Dietterich atua como Cientista-Chefe na BigML, uma plataforma de aprendizado de máquina baseada em nuvem com sede em Corvallis, Oregon. Sua eleição como presidente da AAAI em 2012 foi anunciada no mesmo período, chamando a atenção para seus papéis públicos duplos como líder institucional e figura da indústria de ML.

Presidência da AAAI (2014–2016)

Como presidente da Association for the Advancement of Artificial Intelligence durante o que acabou sendo um ponto de inflexão na conscientização pública sobre IA, Dietterich foi co-autor — com Eric Horvitz — do ponto de vista de 2015 no CACM , uma das primeiras respostas comedidas do campo ao crescente alarme público sobre superinteligência e risco existencial. Sua posição pública foi consistentemente de que os riscos realistas de curto prazo da IA giram em torno de erros, falhas de sistema e superfícies de ataque cibernético, em vez de agência autônoma malévola.


Principais Contribuições

  • Códigos de Saída com Correção de Erros (ECOC) (com Ghulum Bakiri, JAIR 1995) — Mostrou que atribuir a cada classe uma palavra-código de um código de correção de erros e treinar um classificador binário por posição de bit melhora sistematicamente a generalização em problemas multiclasse; a técnica continua sendo uma abordagem de referência e está entre os artigos mais citados de Dietterich.
  • Formalização do Aprendizado de Instância Múltipla (MIL) (com Lozano-Pérez e outros, AI Journal 1997) — Introduziu a formulação canônica de rotulagem em nível de saco, motivada pela previsão de atividade de fármacos, na qual um saco é positivo se pelo menos uma de suas instâncias for positiva; o MIL tornou-se um subcampo próprio com centenas de artigos subsequentes em visão computacional, texto e biomedicina.
  • Aprendizado por Reforço Hierárquico MAXQ (JAIR 2000) — Introduziu a decomposição da função valor MAXQ, que representa uma tarefa como um grafo acíclico direcionado de subtarefas e fornece tanto um algoritmo de aprendizado convergente quanto um framework para abstração de estado; vencedor do Prêmio de Melhor Artigo do JAIR (2003).
  • Pesquisa sobre Métodos Ensemble (2000) — Seu estudo comparativo de boosting, bagging e randomização, apresentado como um artigo de 2000 no periódico Machine Learning, tornou-se a referência prática mais utilizada no campo para o design de classificadores ensemble.
  • Testes estatísticos para comparação de algoritmos de aprendizado (Machine Learning, 1998) — Forneceu a primeira avaliação sistemática de quais testes estatísticos (teste t corrigido, McNemar, etc.) têm taxas de erro Tipo I aceitáveis para comparações de ML; ainda amplamente citado em metodologia empírica de ML.
  • Co-fundação do Journal of Machine Learning Research — Com outros, Dietterich ajudou a estabelecer o JMLR como um contrapeso de acesso aberto a venues com acesso por assinatura, moldando as normas de publicação do campo antes de os preprints do arXiv se tornarem padrão.
  • Sustentabilidade computacional / Informática ecológica — Desenvolveu modelos gráficos probabilísticos e métodos de previsão estruturada para modelagem de migração de aves (em colaboração com o programa eBird do Cornell Lab of Ornithology), manejo de incêndios florestais e manejo de espécies invasoras; um programa de pesquisa aplicada sustentado por 15 anos.
  • Moderação do arXiv cs.LG — Atua como moderador principal da categoria de aprendizado de máquina da seção de Ciência da Computação do arXiv, um papel amplamente invisível, mas institucionalmente significativo, na manutenção da principal infraestrutura de preprints para o campo.

Prêmios e Reconhecimento

  • AAAI Distinguished Service Award — Por contribuições sustentadas à comunidade de ML como editor, presidente de sociedade e organizador de programa.
  • ACML Distinguished Contribution Award — Reconhecido pela Asian Conference on Machine Learning por contribuições para a comunidade de pesquisa em ML asiática em geral.
  • AAAI Fellow (eleito 1994) — Entre o primeiro grupo de Fellows da AAAI.
  • ACM Fellow (eleito 2003) — Por contribuições ao aprendizado de máquina.
  • AAAS Fellow (2007) — American Association for the Advancement of Science, reconhecendo impacto interdisciplinar.
  • OSU Distinguished Professor (2013) — Mais alta designação acadêmica da universidade.
  • Prêmio de Melhor Artigo do JAIR (2003) — Pelo artigo sobre RL hierárquico MAXQ.
  • NSF Presidential Young Investigator Award (1987–1992) — Reconhecimento de início de carreira pela excelência em pesquisa.
  • IBM Graduate Fellowship (1982, 1983) — Apoiou a pesquisa de doutorado em Stanford.
  • Presidente Fundador, International Machine Learning Society — Estabeleceu a estrutura de governança para a série de conferências ICML.
  • Presidente, AAAI (2014–2016) — Liderou a principal associação profissional do campo durante um período de rápido escrutínio público da IA.

Relacionamentos Chave

  • Bruce G. Buchanan — Orientador de doutorado em Stanford; Buchanan foi um pioneiro dos sistemas especialistas e do projeto MYCIN, e seu trabalho em IA intensiva em conhecimento moldou diretamente a pesquisa inicial de Dietterich sobre interpretação de dados orientada por teoria.
  • Eric Horvitz — Colega e co-autor de longa data; juntos escreveram o artigo de 2015 no CACM sobre riscos da IA; Horvitz tem sido uma figura importante na Microsoft Research e atuou como presidente da AAAI antes de Dietterich.
  • Prasad Tadepalli — Colega próximo da OSU e co-autor; sua colaboração abrange aprendizado estruturado, planejamento e RL hierárquico.
  • Pedro Domingos — Co-autor no artigo de agenda (2008); Domingos é uma das vozes públicas mais proeminentes em ML da mesma geração.
  • Dan Hendrycks — Listado entre co-autores no Google Scholar; Hendrycks, agora Diretor do Center for AI Safety, representa a próxima geração de pesquisadores que trabalham em robustez e segurança — temas que se conectam ao interesse de longa data de Dietterich em sistemas de ML confiáveis.
  • Tomas Lozano-Pérez — Colaborador do MIT e co-autor nos artigos originais sobre aprendizado de instância múltipla; a colaboração uniu a perspectiva de ML de Dietterich com a modelagem de conformadores de moléculas e robótica de Lozano-Pérez.
  • Jude Shavlik — Colega de Wisconsin e co-autor; parte da mesma geração de pesquisadores de ML que construíram a infraestrutura institucional do campo junto com Dietterich.

Estilo Pessoal

A voz pública de Dietterich é caracteristicamente comedida: ele tem sido notavelmente resistente tanto aos polos utópicos quanto distópicos do discurso sobre IA, preferindo estruturas empíricas e de engenharia à especulação filosófica. Seu comentário de 2015 com Horvitz é um modelo desse estilo — reconhecendo preocupações legítimas sobre acidentes e uso indevido de IA, enquanto explicitamente coloca entre parênteses cenários envolvendo autoconsciência malévola. Nas redes sociais, ele mantém uma presença ativa, mas de baixa temperatura, engajando-se com questões técnicas e comentários políticos sem alarmismo performativo. Seu compromisso sustentado com a sustentabilidade computacional — uma área de aplicação fora de moda em relação à era das leis de escala — reflete uma prioridade baseada em princípios no impacto social sobre a novidade técnica, consistente com seu comentário frequentemente citado de que quer que suas habilidades técnicas importem para os ecossistemas da Terra. Ele se descreve como não aceitando mais alunos, um limite que ele impõe publicamente, o que em si reflete uma certa disciplina institucional sobre o que a mentoria responsável exige em escala.


Referências