Arlo Mukai Faria

Formou-se em EECS (ênfase em Ciência da Computação, com minor em Linguística) pela University of California, Berkeley (2004), onde completa doutorado em Ciência de Computação (2013). Trabalhou como pesquisador na International Computer Science Institute (2003-2013), atuando principalmente na área de Reconhecimento de Fala. Fundador de empresas no Vale do Silício e no Brasil, prestando serviços de processamento automático de imagens e voz.

Informações coletadas do Lattes em 23/10/2025

Acadêmico

Formação acadêmica

Doutorado em Computer Science

2005 - 2013

University of California, Berkeley
Título: Automatic Speech Transcript Alignment
Orientador: Nelson Morgan
Coorientador: Daniel L Klein. Bolsista do(a): University of California, Berkeley, UCB, Estados Unidos. Palavras-chave: Automatic Speech Recognition; Speech Processing; Digital Signal Processing.Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação. Setores de atividade: Atividades dos serviços de tecnologia da informação.

Graduação em Electrical Engineering and Computer Science

2000 - 2004

University of California, Berkeley
Orientador: Prof. Nelson Morgan
Bolsista do(a): University of California, Berkeley, UCB, Estados Unidos.

Formação complementar

2005 - 2005

AMI Training Program. , University of Edinburgh, EDINBURGH, Escócia.

2002 - 2002

Engenharia. (Carga horária: 15h). , Tohoku University.

Idiomas

Bandeira representando o idioma Inglês

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Espanhol

Compreende Razoavelmente, Fala Razoavelmente, Lê Razoavelmente, Escreve Razoavelmente.

Bandeira representando o idioma Português

Compreende Bem, Fala Razoavelmente, Lê Bem, Escreve Bem.

Bandeira representando o idioma Japonês

Compreende Pouco, Fala Pouco, Lê Pouco, Escreve Pouco.

Áreas de atuação

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação.

Grande área: Engenharias / Área: Engenharia Elétrica / Subárea: Telecomunicações/Especialidade: Sistemas de Telecomunicações.

Grande área: Ciências Exatas e da Terra / Área: Probabilidade e Estatística / Subárea: Probabilidade e Estatística Aplicadas.

Grande área: Lingüística, Letras e Artes / Área: Lingüística.

Produções bibliográficas

  • MEI-YUH HWANG ; GANG PENG ; OSTENDORF, M. ; WEN WANG ; FARIA, A. ; HEIDEL, A. . Building A Highly Accurate Mandarin Speech Recognizer With Language-Independent Technologies and Language-Dependent Modules. IEEE Transactions on Audio, Speech, and Language Processing , v. 17, p. 1253-1262, 2009.

  • FARIA, A. M. . Lecture Notes in Computer Science (MLMI-05). 1. ed. Heidelberg: Springer, 2006.

  • VERGYRI, D. ; MANDAL, A. ; WANG, W. ; STOLCKE, A. ; ZHENG, J. ; GRACIARENA, M. ; RYBACH, D. ; GOLLAN, C. ; SCHLATER, R. ; KIRCHOFF, K. ; FARIA, A. M. ; MORGAN, N. . Development of the SRI/Nightingale Arabic ASR System. In: Interspeech, 2008, Brisbane. Proceedings of Interspeech, 2008.

  • CHONG, J. ; YI, Y. ; FARIA, A. M. ; RAJAGOPALAN, S. ; KEUTZER, K. . Data-Parallel Large Vocabulary Continuous Speech Recognition on Graphics Processors. In: Workshop on Emerging Applications and Many-core Architecture (EAMA)., 2008, Beijing. Workshop on Emerging Applications and Many-core Architecture (EAMA)., 2008.

  • FARIA, ARLO ; MORGAN, NELSON . Corrected tandem features for acoustic model training. In: ICASSP 2008 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, 2008, Las Vegas. 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, 2008. p. 4737.

  • MEI-YUH HWANG ; GANG PENG ; WEN WANG ; FARIA, ARLO ; HEIDEL, AARON ; OSTENDORF, MARI . Building a highly accurate Mandarin speech recognizer. In: , 2007, The Westin Miyako Kyoto. , 2007. p. 490.

  • PETROV, S. ; FARIA, A. M. ; MICHAILLAT, P. ; BERG, A. ; STOLCKE, A. ; KLEIN, D. ; MALIK, J. . Detecting Categories in News Video Using Acoustic, Speech, and Image Features. In: Video TREC (TRECVID) Workshop, 2006, Washington, DC. Proceedings of Video TREC (TRECVID), 2006.

  • FARIA, A. M. ; GELBART, D. . Efficient Pitch-based Estimation of VTLN Warp Factors. In: Interspeech, 2005, Lisboa. Proceedings of Interspeech, 2005.

Outras produções

FARIA, A. M. ; SHANKAR, A. . Modista. 2008; Tema: Modista: explore your style!. (Site).

Projetos de pesquisa

  • 2012 - Atual

    IARPA Babel Program, Descrição: The Babel Program is developing agile and robust speech recognition technology that can be rapidly applied to any human language in order to provide effective search capability for analysts to efficiently process massive amounts of real-world recorded speech. Today s transcription systems are built on technology that was originally developed for English, with markedly lower performance on non-English languages. These systems have often taken years to develop and cover only a small subset of the languages of the world. Babel intends to demonstrate the ability to generate a speech transcription system for any new language within one week to support keyword search performance for effective triage of massive amounts of speech recorded in challenging real-world situations. The goal of the Babel Program is to develop methods to build speech recognition technology for a much larger set of languages than has hitherto been addressed. The Program requires innovations in how to rapidly model a novel language with significantly less training data that are also much noisier and more heterogeneous than what has been used in the current state-of-the-art. Babel's technical measures of success are focused on how well the generated model works to support effective word-based search of noisy channel speech in the languages to be investigated. The new methods are being systematized so that they can be applied rapidly to a novel underserved language.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (1) / Doutorado: (10) . , Integrantes: Arlo Mukai Faria - Coordenador / Nelson Morgan - Integrante / Steven Wegmann - Integrante / Mari Ostendorf - Integrante / eric fosler-lussier - Integrante / Daniel P. W. Ellis - Integrante / Janet Pierrehumbert - Integrante / Jim Hieronymus - Integrante / Adam Janin - Integrante / David Imseng - Integrante / Korbinian Riedhammer - Integrante / Frantisek Grezl - Integrante.

  • 2008 - 2013

    Parallel Computing Laboratory, Descrição: http://parlab.eecs.berkeley.edu/about. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Doutorado: (50) . , Integrantes: Arlo Mukai Faria - Coordenador / Nelson Morgan - Integrante / Kurt Keutzer - Integrante / David Patterson - Integrante / Jike Chong - Integrante., Financiador(es): Microsoft Corporation - Auxílio financeiro.

  • 2006 - 2009

    DARPA GALE Program, Descrição: The goal of the DARPA GALE program is to produce a system that is able to automatically take multilingual newscasts, text documents, and other forms of communication, and make their information available to human queries. GALE has three major technical challenges: automatic speech recognition, to process audio data, machine translation, to translate non-English data, and distillation, to extract the most useful pieces of information related to a given query.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Doutorado: (5) . , Integrantes: Arlo Mukai Faria - Coordenador / Nelson Morgan - Integrante / Mari Ostendorf - Integrante / Andreas Stolcke - Integrante / Dimitra Vergyri - Integrante / wen wang - Integrante / mei-yuh hwang - Integrante., Financiador(es): Defense Advanced Research Projects Agency - Auxílio financeiro.

  • 2004 - 2010

    AMI Project, Descrição: http://www.amiproject.org/. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (5) / Doutorado: (20) . , Integrantes: Arlo Mukai Faria - Coordenador / Steve Renals - Integrante., Financiador(es): European Commission - Auxílio financeiro.

Projetos de desenvolvimento

  • 2013 - Atual

    Automatic Alignment of Real-world Data, Descrição: NSF SBIR grant proposal, currently under review.. , Situação: Em andamento; Natureza: Desenvolvimento. , Alunos envolvidos: Graduação: (2) / Doutorado: (1) . , Integrantes: Arlo Mukai Faria - Coordenador / Korbinian Riedhammer - Integrante / daniel gillick - Integrante / eric battenberg - Integrante., Financiador(es): National Science Foundation - Auxílio financeiro.

Prêmios

2013

Fellowship in EECS Entrepreneurship, Andrew T. Yang / UC Berkeley EECS Department.

2011

Wildcard Prize ($10,000), Evernote Developer Competition.

2009

Winner, UC Berkeley Venture Lab Competition.

2008

First Place, UC Berkeley Business Plan Competition.

2005

Chancellor's Fellowship for Graduate Study, University of California, Berkeley.

2005

Award for Engineering Design, Warren Dere / UC Berkeley EECS Department.

Histórico profissional

Endereço profissional

  • International Computer Science Institute. , 1947 Center Street, Suite 600, --, 94704 - Berkeley, - Estados Unidos, URL da Homepage:

Experiência profissional

2006 - 2009

SRI International

Vínculo: , Enquadramento Funcional:

2006 - 2006

University of California, Berkeley

Vínculo: Colaborador, Enquadramento Funcional: Graduate Student Researcher, Carga horária: 40

Outras informações:
TREC Video Retrieval Project

Atividades

  • 08/2013

    Outras atividades técnico-científicas , EECS - Electrical Engineering and Computer Science, .,Atividade realizada, Fellowship in EECS Entrepreneurship.

  • 06/2006 - 08/2012

    Pesquisa e desenvolvimento , EECS - Electrical Engineering and Computer Science, .,Linhas de pesquisa

  • 01/2006 - 05/2006

    Ensino, Computer Science, Nível: Graduação,Disciplinas ministradas, Inteligência Artificial (Artificial Intelligence)

2005 - 2005

University of Edinburgh

Vínculo: Bolsista, Enquadramento Funcional: Pesquisador Visitante, Carga horária: 40

Outras informações:
Augmented Multimodal Interaction Training Programme, funded by the European Union, at the Centre for Speech Technology Research

Atividades

  • 01/2005 - 08/2005

    Pesquisa e desenvolvimento , Centre For Speech Technology Research, .,Linhas de pesquisa

2003 - 2003

International Computer Science Institute

Vínculo: Bolsista, Enquadramento Funcional: Pesquisador Estagiário, Carga horária: 40

Outras informações:
Programa: SUPERB-IT Apoio: National Science Foundation (EUA)

Atividades

  • 01/2012 - 05/2013

    Pesquisa e desenvolvimento , Speech Group, .,Linhas de pesquisa

  • 01/2011 - 09/2011

    Outras atividades técnico-científicas , Speech Group, .,Atividade realizada, ICSI-Brazil Visitor Program: Associação Brasileira de Desenvolvimento Industrial / Movimento Brasil Competitivo.

  • 01/2007 - 08/2008

    Pesquisa e desenvolvimento , Speech Group, .,Linhas de pesquisa

  • 06/2004 - 12/2004

    Pesquisa e desenvolvimento , Speech Group, .,Linhas de pesquisa

  • 06/2003 - 08/2003

    Estágios , Speech Group, .,Estágio realizado, NSF-funded SUPERB-IT program: Vocal Tract Length Normalization.