Eli Cortez

Eli Cortez é pesquisador visitante no DMX, um laboratório da Microsoft Research - Redmond / EUA. Anteriormente, ele co-fundou uma startup chamada Neemu E-Commerce Technologies, onde ele também trabalhou como cientista-chefe, de 2009 a 2013. Ele obteve seu Ph.D. em Ciência da Computação da Universidade Federal do Amazonas / Brasil (2012), e seu MS (2009) e B.S. (2008) em Ciência da Computação na mesma Universidade. Seus interesses de pesquisa incluem a extração de informação, mineração de dados e aprendizado de máquina. (http://cortez.me/)

Informações coletadas do Lattes em 06/09/2025

Acadêmico

Formação acadêmica

Doutorado em Informática

2009 - 2012

Universidade Federal do Amazonas
Título: Unsupervised Information Extraction by Text Segmentation
Orientador: Altigran Soares da Silva
Bolsista do(a): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior. Palavras-chave: Banco de Dados; Machine Learning; Information Extraction.Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação. Setores de atividade: Atividades dos serviços de tecnologia da informação.

Mestrado em Informática

2008 - 2009

Universidade Federal do Amazonas
Título: Extração de Dados em Texto Semi-Estruturado,Ano de Obtenção: 2009
Altigran Soares da Silva.Bolsista do(a): Fundação de Amparo a Pesquisa do Estado do Amazonas. Palavras-chave: Extração de Dados; Recuperação de Informação; Internet.

Graduação em Ciência da Computação

2004 - 2007

Universidade Federal do Amazonas
Título: Flux-Cim: Flexible Unsupervised Extraction of Citation Metadata
Orientador: Altigran Soares da Silva
Bolsista do(a): Conselho Nacional de Desenvolvimento Científico e Tecnológico.

Ensino Médio (2º grau)

2001 - 2003

Centro Educacional Batista das Américas

Formação complementar

1999 - 2004

Extensão universitária em Curso de Idiomas (Lingua Inglesa). , Yazigi Internexus.

Idiomas

Bandeira representando o idioma Inglês

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Espanhol

Compreende Razoavelmente, Fala Razoavelmente, Lê Razoavelmente, Escreve Pouco.

Bandeira representando o idioma Português

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Áreas de atuação

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Metodologia e Técnicas da Computação/Especialidade: Banco de Dados.

Grande área: Ciências Sociais Aplicadas / Área: Ciência da Informação / Subárea: Biblioteconomia/Especialidade: Técnicas de Recuperação de Informação.

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Metodologia e Técnicas da Computação/Especialidade: Sistemas de Informação.

Participação em eventos

Simposio Brasileiro de Banco de Dados.FLUX-CiM: flexible unsupervised extraction of citation metadata. 2008. (Simpósio).

ACM SIGMOD/PODS Conference.A Flexible Approach for Extracting Metadata from Bibliographic Citations. 2008. (Outra).

SBIGRAPH -Simposio Brasileiro de Computacao Grafica. 2006. (Congresso).

SBIE - Simposio Brasileiro de Informatica na Educacao. 2004. (Congresso).

Produções bibliográficas

  • Cortez, Eli ; Rojas Herrera, Mauro ; da Silva, Altigran S. ; de Moura, Edleno S. ; Neubert, Marden . Lightweight methods for large-scale product categorization. Journal of the American Society for Information Science and Technology (Print) , v. 62, p. 1839-1848, 2011.

  • Elton Serra ; Cortez, Eli ; da Silva, Altigran S. ; de Moura, Edleno S. . On Using Wikipedia to Build Knowledge Bases for Information Extraction by Text Segmentation. Journal of Information and Data Management - JIDM , v. 2, p. 259-272, 2011.

  • EVANGELISTA, L. ; Cortez, Eli ; SILVA, A. S. ; Meira, W. . Adaptive and Flexible Blocking for Record Linkage Tasks. Journal of Information and Data Management - JIDM , v. 1, p. 167-181, 2010.

  • TODA, G. A. ; Cortez, Eli ; da Silva, Altigran S. ; de Moura, Edleno S. . A Probabilistic Approach for Automatically Filling Form-Based Web Interfaces. Proceedings of the VLDB Endowment , v. 4, p. 151-160, 2010.

  • VILARINHO, E. C. C. ; da Silva, Altigran S. ; Gonçalves, Marcos André ; Mesquita, Filipe ; de Moura, Edleno S. . A flexible approach for extracting metadata from bibliographic citations. Journal of the American Society for Information Science and Technology , v. 60, p. 1144-1158, 2009.

  • da Silva, Altigran S. . Unsupervised Information Extraction by Text Segmentation. 1. ed. Springer International Publishing, 2013. v. 1. 95p .

  • Cortez, Eli ; da Silva, Altigran S. ; de Moura, Edleno S. ; Daniel Oliveira ; Alberto H. F. Laender . Joint unsupervised structure discovery and information extraction. In: ACM SIGMOD - International conference on Management of data, 2011, Athens. SIGMOD '11 Proceedings of the 2011 international conference on Management of data. New York: ACM, 2011. p. 541-552.

  • VILARINHO, E. C. C. ; SILVA, A. S. ; GONCALVES, M. A. ; Silva de Moura, E. . ONDUX: on-demand unsupervised learning for information extraction. In: SIGMOD International Conference on Management of Data, 2010, INDIANAPOLIS. Proceedings of the 2010 international conference on Management of data, 2010.

  • EVANGELISTA, L. ; VILARINHO, E. C. C. ; SILVA, A. S. ; Meira, W. . Blocagem Adaptativa e Flexível para o Pareamento Aproximado de Registros. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 2009, FORTALEZA. SIMPOSIO BRASILEIRO DE BANCO DE DADOS, 2009.

  • VILARINHO, E. C. C. ; SILVA, A. S. ; GONCALVES, M. A. ; MESQUITA, F. ; Silva de Moura, E. . FLUX-CiM: flexible unsupervised extraction of citation metadata. In: XXIII Simpósio Brasileiro de Banco de Dados, 2008, Campinas. Simpósio Brasileiro de Banco de Dados, 2008.

  • VILARINHO, E. C. C. ; SILVA, A. S. ; GONCALVES, M. A. ; MESQUITA, F. ; Silva de Moura, E. . Flux-Cim : Flexible Unsupervised Extraction of Citation Metadata. In: ACM IEEE Joint Conference on Digital Libraries, 2007, Vancouver, Canada., 2007, Vancouver. Proceedings of the ACM IEEE Joint Conference on Digital Libraries, 2007.

  • MESQUITA, F. ; BARBOSA, D. ; VILARINHO, E. C. C. ; SILVA, A. S. . FleDEx: Flexible Data Exchange. In: ACM International Workshop on Web Information and Data Management, 2007, Lisboa., 2007, Lisboa. Proceedings of the ACM International 9th Workshop on Web Information and Data Management. New York, NY, USA: ACM, 2007.

  • Oliveira, R. ; MESQUITA, F. ; SILVA, A. S. ; VILARINHO, E. C. C. . Extração de dados e metadados em textos semi-estruturados usando HMMs. In: Simpósio Brasileiro de Bancos de Dados, 2006, Florianopolis. Anais do XXI Simpósio Brasileiro de Bancos de Dados, 2006. p. 117-131.

  • TODA, G. A. ; Cortez, Eli ; da Silva, Altigran S. ; de Moura, Edleno S. ; N. Marden . Automatically filling form-based web interfaces with free text inputs.. In: International World Wide Web Conferences, 2009, Madrid. Proceedings of International World Wide Web Conferences WWW, 2009.

  • VILARINHO, E. C. C. ; SILVA, A. S. . A Flexible Approach for Extracting Metadata from Bibliographic Citations. In: ACM SIGMOD/PODS Conference, 2008, Vancouver. CM SIGMOD/PODS Conference 2008. SIGMOD Undergraduate Posters, 2008.

  • Cortez, Eli . Methods and Techniques for Information Extraction by Text Segmentation. 2012. (Apresentação de Trabalho/Conferência ou palestra).

  • Cortez, Eli . Information Extraction over Textual Sources. 2011. (Apresentação de Trabalho/Conferência ou palestra).

  • Cortez, Eli . Joint Unsupervised Structure Discovery and Information Extraction. 2011. (Apresentação de Trabalho/Conferência ou palestra).

  • Cortez, Eli . A Probabilistic Approach for Automatically Filling Form-Based Web Interfaces. 2011. (Apresentação de Trabalho/Conferência ou palestra).

  • Cortez, Eli ; SILVA, A. S. . Methods and Techniques for Information Extraction by Text Segmentation. 2011. (Apresentação de Trabalho/Simpósio).

  • Cortez, Eli ; da Silva, Altigran S. ; GONCALVES, M. A. ; de Moura, Edleno S. . ONDUX: on-demand unsupervised learning for information extraction.. 2010. (Apresentação de Trabalho/Conferência ou palestra).

  • EVANGELISTA, L. ; Cortez, Eli ; da Silva, Altigran S. ; Meira, W. . Blocagem Adaptativa e Flexível para o Pareamento Aproximado de Registros. 2009. (Apresentação de Trabalho/Conferência ou palestra).

  • VILARINHO, E. C. C. ; FLUX-CiM: flexible unsupervised extraction of citation metadata. 2008. (Apresentação de Trabalho/Simpósio).

  • VILARINHO, E. C. C. ; A Flexible Approach for Extracting Metadata from Bibliographic Citations. 2008. (Apresentação de Trabalho/Conferência ou palestra).

  • VILARINHO, E. C. C. ; SILVA, A. S. ; GONCALVES, M. A. ; MESQUITA, F. ; Silva de Moura, E. . Flux-Cim : Flexible Unsupervised Extraction of Citation Metadata. 2007. (Apresentação de Trabalho/Conferência ou palestra).

Outras produções

MESQUITA, F. ; BARBOSA, D. ; VILARINHO, E. C. C. ; SILVA, A. S. . A Lightweight Framework for Exchanging Web Data. 2007.

Projetos de pesquisa

  • 2010 - 2013

    Extração de Informação em Fontes Textuais, Projeto certificado pelo(a) coordenador(a) Altigran Soares da Silva em 07/01/2015., Descrição: Este projeto é uma continuação do projeto financiado no ano de 2010 pelo Programa UOL Bolsa Pesquisa. Visa à extensão, formalização e divulgação de uma nova abordagem para extração não-supervisionada de informações disponíveis em fontes textuais genéricas, a qual foi desenvolvida no projeto passado. Pretendemos estender nossa abordagem em três aspectos principais: (1) Simultaneamente à extração das informações, descobrir e extrair a estrutura de objetos complexos presentes em fontes textuais (tabelas, listas, registros), o que é uma limitação real identificada nos atuais métodos de extração e que prejudica a total automatização do processo; (2) Atualmente a extração não-supervisionada (sem a interferência do usuário) com nossa abordagem alcança altos níveis de qualidade (acima de 90% em medida F). Para atingir níveis mais próximos a 100% pretendemos desenvolver técnicas baseadas em Relevance Feedback e Active Learning para incorporar de forma inteligente e não intensiva o julgamento do usuário ao processo de extração; (3) Nossa abordagem depende da construção prévia de bases de conhecimento no domínio das informações a serem extraídas. Pretendemos desenvolver uma série de técnicas para obtenção destas bases de forma massiva a partir de bases estruturadas disponíveis na Web (p.ex., Wikipedia). , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Doutorado: (1) . , Integrantes: Eli Cortez - Integrante / Altigran Soares da Silva - Coordenador., Financiador(es): Universo Online - Bolsa.

Prêmios

2013

Melhor Tese de Doutorado, SBC - Sociedade Brasileira de Computação.

2013

Grande Prêmio Capes de Teses - Menção Honrosa, CAPES - MEC.

2011

Best Demo, SBC - SBBD.

2009

Best Paper do Simpósio Brasileiro de Bando de Dados 2009, SBC - SBBD.

2008

Winner Undergraduate Poster Competition SIGMOD 2008, Special Interest Group on Management of Data.

Histórico profissional

Endereço profissional

  • Microsoft Corporation. , 4865 NE 36th Street, Microsoft, Redmond, - Estados Unidos, Telefone: (1888) 8888888

Experiência profissional

2014 - Atual

Microsoft Corporation

Vínculo: Applied Researcher, Enquadramento Funcional: Applied Researcher, Carga horária: 40, Regime: Dedicação exclusiva.

2012 - 2013

Neemu Tecnologia

Vínculo: Cientista Chefe, Enquadramento Funcional: Cientista Chefe, Carga horária: 40, Regime: Dedicação exclusiva.

2013 - 2014

Microsoft Research

Vínculo: Visiting Researcher, Enquadramento Funcional: Visiting Researcher, Carga horária: 40, Regime: Dedicação exclusiva.

2012 - 2012

Microsoft Research

Vínculo: Reseach Intern, Enquadramento Funcional: Reseach Intern, Carga horária: 40

2010 - 2013

Universidade Federal do Amazonas

Vínculo: , Enquadramento Funcional: