Pedro Paulo Balage Filho

Estudante de doutorado no Programa de Ciências de Computação e Matemática Computacional pela Universidade de São Paulo (2012 - atual). Possui mestrado em Processamento de Linguagem Natural ERASMUS MUNDUS pela Universidade de Wolverhampton (2010-2011) e pela Universidade do Algarve (2011-2012). Possui graduação em Ciências da Computação pela Universidade de São Paulo (2005-2009). Tem experiência em Processamento de Linguagem Natural e trabalha atualmente com a área de análise de sentimentos e mineração de opinião.

Informações coletadas do Lattes em 19/08/2025

Acadêmico

Formação acadêmica

Doutorado em andamento em Ciências da Computação e Matemática Computacional

2012 - Atual

Universidade de São Paulo
Título: Análise de Sentimentos Orientada a Aspectos: Extração de Informação e Aplicações para Textos na Língua Portuguesa,
Thiago Alexandre Salgueiro Pardo. Bolsista do(a): Fundação de Amparo à Pesquisa do Estado de São Paulo, FAPESP, Brasil. Grande área: Ciências Exatas e da Terra

Mestrado em Natural Language Processing

2010 - 2012

University of Wolverhampton
Título: Use of Discourse Knowledge to Improve Lexicon-based Sentiment Analysis,Ano de Obtenção: 2012
Orientador: Constatin Orasan
com Coorientador: Mário Jorge Gaspar da Silva. Bolsista do(a): Erasmus Mundus Programme, EU, Inglaterra.

Graduação em Ciências de Computação

2005 - 2009

Universidade de São Paulo
Orientador: em Universidade de Lisboa ( Antonio Horta Branco)
com Bolsista do(a): Programa de Educação Tutorial, PET, Brasil.

Curso técnico/profissionalizante em Desenvolvimento de Sistemas Comerciais

2002 - 2004

Centro Federal de Educação Tecnológica de São Paulo

Formação complementar

2014 - 2014

Extensão universitária em EMC² Summer School on Big Data. (Carga horária: 24h). , Universidade Federal do Rio de Janeiro, UFRJ, Brasil.

2014 - 2014

School on Machine Learning and KDD. (Carga horária: 20h). , Universidade de São Paulo, USP, Brasil.

2014 - 2014

Advances in Machine Learning for Social Media. (Carga horária: 30h). , Wroclaw University of Technology, PWR, Polônia.

2013 - 2013

MOOC - Data Mining with WEKA. , University of Waikato, WAIKATO, Nova Zelândia.

2012 - 2012

Machine Learning. , Coursera.org - Massive Open Online Courses, COURSERA, Estados Unidos.

2008 - 2008

Computational Logic and Cognitive Science. (Carga horária: 40h). , Technische Universität Dresden, TUD, Alemanha.

Idiomas

Bandeira representando o idioma Inglês

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Espanhol

Compreende Bem, Fala Razoavelmente, Lê Bem, Escreve Razoavelmente.

Bandeira representando o idioma Português

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Francês

Compreende Razoavelmente, Fala Razoavelmente, Lê Razoavelmente, Escreve Pouco.

Áreas de atuação

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Processamento de Linguagem Natural.

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação.

Organização de eventos

CASELI, H. M. ; RAMISCH, C. ; BALAGE FILHO, P. P. . III Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic). 2013. (Congresso).

Participação em eventos

8th International Workshop on Semantic Evaluation (SemEval 2014). NILC_USP: Aspect Extraction using Semantic Labels. 2014. (Congresso).

11th International Conference on Computational Processing of Portuguese Language. Software Demonstration. BuscaOpinioes: Searching for Opinions over the Internet. 2014. (Congresso).

9th Brazilian Symposium in Information and Human Language Technology.An Evaluation of the Brazilian Portuguese LIWC Dictionary for Sentiment Analysis. 2013. (Simpósio).

Workshop of PhD and MSc Research (WTD).Aspect-based Sentiment Analysis: Information Extraction and Applications for Portuguese texts. 2013. (Simpósio).

3rd Workshop on Natural Language Processing and Human Language Technology. Use of Discourse Knowledge to Improve Lexicon-based Sentiment Analysis. 2012. (Congresso).

VI Escola Brasileira de Linguística Computacional (EBRALC 2012). 2012. (Oficina).

XI Encontro de Linguística de Corpus (ELC 2012). 2012. (Encontro).

Participação em bancas

Aluno: Patricia Figueira Goldberg

BRAGA, R. T. V.BALAGE FILHO, P. P.. Sistemas de Informação como apoio para Marketing Digital. 2014. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) - Universidade de São Paulo.

Aluno: Gabriela Wick Pedro

VALE, O. A.BALAGE FILHO, P. P.. Estudo de anotação de opiniões em um corpus de comentários. 2014. Trabalho de Conclusão de Curso (Graduação em Linguística) - Universidade Federal de São Carlos.

Aluno: Renan Gabriel Pegaiane

REZENDE, S.BALAGE FILHO, P. P.. Customização IStore EBS. 2013. Trabalho de Conclusão de Curso (Graduação em Ciências de Computação) - Universidade de São Paulo.

Aluno: Eduardo Mikio Tanaka

MOREIRA, D.BALAGE FILHO, P. P.. Em busca de uma plataforma gamificada para o ensino de programação. 2013. Trabalho de Conclusão de Curso (Graduação em Ciências de Computação) - Universidade de São Paulo.

Aluno: [Nome removido após solicitação do usuário]

PIMENTEL, M. G. C.BALAGE FILHO, P. P.. Utilização de elementos de jogos para o aprimoramento de uma ferramenta de ensino de programação. 2013. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade de São Paulo.

Aluno: Pedro Paulo Canto Martucci

PIMENTEL, M. G. C.BALAGE FILHO, P. P.. Desenvolvimento de Software em uma Plataforma de Inteligência Analítica. 2013. Trabalho de Conclusão de Curso (Graduação em Ciências de Computação) - Universidade de São Paulo.

Produções bibliográficas

  • SOBREVILLA CABEZUDO, MARCO ANTONIO ; MAZIERO, ERICK GALANI ; SOUZA, JACKSON WILKE DA CRUZ ; DIAS, MÁRCIO DE SOUZA ; CARDOSO, PAULA CHRISTINA FIGUEIRA ; Balage Filho, Pedro Paulo ; AGOSTINI, VERÔNICA ; NÓBREGA, FERNANDO ANTÔNIO ASEVEDO ; DE BARROS, CLÁUDIA DIAS ; DI FELIPPO, ARIANI ; PARDO, THIAGO ALEXANDRE SALGUEIRO . Anotação de Sentidos de Verbos em Textos Jornalísticos do Corpus CSTNews. Revista de Estudos da Linguagem , v. 23, p. 797-832, 2015.

  • BALAGE FILHO, P. P. . Use of Discourse Knowledge to Improve Lexicon-based Sentiment Analysis. BULAG - BUlletin de Linguistique Appliquée et Générale , v. 1, p. 3-22, 2012.

  • KONSTANTINOVA, N. ; ORASAN, C. ; BALAGE, P. P. . A Corpus-Based Method for Product Feature Ranking for Interactive Question Answering Systems. International Journal of Computational Linguistics and Applications , v. 3, p. 57-70, 2012.

  • FELIPPO, A. ; RINO, L. H. M. ; PARDO, T. A. S. ; CARDOSO, P. C. F. ; SENO, E. R. M. ; BALAGE FILHO, P. P. ; RASSI, A. P. ; DIAS, M. S. ; JORGE, M. L. R. C. ; MAZIERO, E. G. ; ZACARIAS, A. C. I. ; SOUZA, J. W. C. ; CAMARGO, R. T. ; AGOSTINI, V. . Corpus Annotation of Textual Aspects in Multi-Document Summaries. In: Sandra Maria Aluísio; Stela E. O. Tagnin. (Org.). New Language Technologies and Linguistic Research: A Two-Way Road. 1ed.: Cambridge Scholars Publishing, 2014, v. , p. 171-192.

  • BRUSCHI, S. M ; XAVIER, V.C. ; BALAGE FILHO, P. P. . Teste USP: Multifuncional imprime até fotos. Folha de São Paulo - Caderno de Informática, p. F6 - F6, 10 out. 2007.

  • LOPEZ, R. E. ; AVANCO, L. ; BALAGE FILHO, P. P. ; GARAY, A. Y. B. ; CARDOSO, P. C. F. ; DIAS, M. S. ; NOBREGA, F. A. A. ; CABEZUDO, M. A. S. ; SOUZA, J. W. C. ; ZACARIAS, A. C. I. ; SENO, E. R. M. ; FELIPPO, A. ; PARDO, T. A. S. . A Qualitative Analysis of a Corpus of Opinion Summaries based on Aspects. In: 9th Linguistic Annotation Workshop, 2015, Denver, Colorado, USA. Proceedings of LAW IX - The 9th Linguistic Annotation Workshop, 2015. p. 62-71.

  • HARTMANN, N. ; AVANCO, L. ; BALAGE, P. P. ; DURAN, M. ; NUNES, M. G. V. ; PARDO, T. A. S. ; ALUISIO, S. M. . A Large Corpus of Product Reviews in Portuguese: Tackling Out-Of-Vocabulary Words. In: International Conference on Language Resources and Evaluation (LREC'14), 2014, Reykjavik, Iceland. Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14), 2014. p. 3865-3871.

  • CABEZUDO, M. A. S. ; MAZIERO, E. G. ; SOUZA, J. W. C. ; DIAS, M. S. ; CARDOSO, P. C. F. ; BALAGE FILHO, P. P. ; AGOSTINI, V. ; NOBREGA, F. A. A. . Anotação de Sentidos de Verbos em Notícias Jornalísticas em Português do Brasil. In: XII Encontro de Linguística de Corpus, 2014, Uberlândia. Proceedings of the XII Encontro de Linguística de Corpus - ELC, 2014. p. 1-7.

  • BALAGE FILHO, P. P. ; AVANCO, L. ; NUNES, M. G. V. ; PARDO, T. A. S. . NILC_USP: An Improved Hybrid System for Sentiment Analysis in Twitter Messages. In: 8th International Workshop on Semantic Evaluation (SemEval 2014), 2014, Dublin, Ireland. Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), 2014. p. 428-432.

  • BALAGE FILHO, P. P. ; PARDO, T. A. S. . NILC_USP: Aspect Extraction using Semantic Labels. In: 8th International Workshop on Semantic Evaluation (SemEval 2014), 2014, Dublin, Ireland. Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), 2014. p. 433-436.

  • DIAS, M. S. ; GARAY, A. Y. B. ; CHUMAN, C. ; BARROS, C. D. ; MAZIERO, E. G. ; NOBREGA, F. A. A. ; SOUZA, J. W. C. ; CABEZUDO, M. A. S. ; DELEGE, M. ; JORGE, M. L. R. C. ; SILVA, N. L. ; CARDOSO, P. C. F. ; BALAGE FILHO, P. P. ; LOPEZ, R. E. ; FELIPPO, A. ; NUNES, M. G. V. ; PARDO, T. A. S. . Enriquecendo o Córpus CSTNews - a Criação de Novos Sumários Multidocumento. In: I Workshop on Tools and Resources for Automatically Processing Portuguese and Spanish - ToRPorEsp, 2014, São Carlos. Proceedings of the I Workshop on Tools and Resources for Automatically Processing Portuguese and Spanish - ToRPorEsp, 2014. p. 1-8.

  • BALAGE FILHO, P. P. ; PARDO, T. A. S. . NILC_USP: A Hybrid System for Sentiment Analysis in Twitter Messages. In: Seventh International Workshop on Semantic Evaluation (SemEval 2013), 2013, Atlanta, Georgia. Second Joint Conference on Lexical and Computational Semantics (*SEM), Volume 2: Proceedings of the Seventh International Workshop on Semantic Evaluation (SemEval 2013), 2013. v. 2. p. 568-572.

  • BALAGE FILHO, P. P. ; ALUISIO, S. M. ; PARDO, T. A. S. . An Evaluation of the Brazilian Portuguese LIWC Dictionary for Sentiment Analysis. In: 9th Brazilian Symposium in Information and Human Language Technology, 2013, Fortaleza, CE. Proceedings of the 9th Brazilian Symposium in Information and Human Language Technology, 2013. p. 215-219.

  • BALAGE FILHO, P. P. ; BRUN, C. ; RONDEAU, G. . A Graphical User Interface for Feature-Based Opinion Mining. In: The 2012 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (ACL) - Demonstration Session, 2012, Québec. Proceedings of the 2012 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Demonstration Session, 2012. p. 5-8.

  • BALAGE FILHO, P. P. ; PARDO, T. A. S. ; NUNES, M. G. V. . Summarizing Scientific Texts: Experiments with Extractive Summarizers. In: Seventh International Conference on Intelligent Systems Design and Applications (ISDA '07), 2007, Rio de Janeiro. Proceedings of the Seventh International Conference on Intelligent Systems Design and Applications (ISDA '07). Washington, DC, USA: IEEE Computer Society, 2007. p. 520-524.

  • BALAGE FILHO, P. P. ; UZEDA, V. R. ; PARDO, T. A. S. ; NUNES, M. G. V. . Using a Text Summarization System for Monolingual Question Answering. In: Cross Language Evaluation Forum 2006 Workshop, 2006, Alicante, Spain. Proceedings for the CLEF 2006 Workshop, 20-22 September, Alicante, Spain, 2006. v. 2006. p. 1-4.

  • BALAGE FILHO, P. P. ; UZEDA, V. R. ; PARDO, T. A. S. ; NUNES, M. G. V. . Experiments on Applying a Text Summarization System for Question Answering. In: Cross Language Evaluation Forum 2006 Workshop, 2006, Alicante. Lecture Notes in Computer Science. Berlin: Springer-Verlag, 2006. v. 4730. p. 372-376.

  • BALAGE FILHO, P. P. ; PARDO, T. A. S. . BuscaOpinioes: Searching for Opinions over the Internet. In: 11th International Conference on Computational Processing of Portuguese Language. Software Demonstration, 2014, São Carlos. Proceedings of the 11th International Conference on Computational Processing of Portuguese Language. Software Demonstration, 2014. p. 1-3.

  • BALAGE FILHO, P. P. ; PARDO, T. A. S. . A Web Interface for Browsing the CSTNews Corpus. In: 9th International Conference on Computational Processing of Portuguese Language - PROPOR - Demos Session, 2010, Porto Alegre-RS. Extended Activities Proceedings of the 9th International Conference on Computational Processing of Portuguese Language - PROPOR, 2010. v. 1. p. 1-2.

  • BALAGE FILHO, P. P. ; PARDO, T. A. S. . Aquisição Automática de Conhecimento Discursivo para o Português do Brasil. In: 16º Simpósio Internacional de Iniciação Científica da Universidade de São Paulo, 2008, São Paulo. Anais do 16º Simpósio Internacional de Iniciação Científica da Universidade de São Paulo. São Paulo: Univerversidade de São Paulo, 2008.

  • BALAGE FILHO, P. P. ; PARDO, T. A. S. ; NUNES, M. G. V. . Experimentos com Sumarização Automática Extrativa de Textos Científicos. In: I Workshop de Iniciação Científica e Tecnológica da Computação - ICMC - USP, 2007, São Carlos. I Workshop de Iniciação Científica e Tecnológica da Computação - ICMC - USP, 2007.

  • BALAGE FILHO, P. P. ; PARDO, T. A. S. ; NUNES, M. G. V. . Sumarização Automática de Artigos Científicos. In: 15o. Simpósio Internacional de Iniciação Científica da Universidade de São Paulo, 2007, São Carlos. Anais do 15o. Simpósio Internacional de Iniciação Científica da Universidade de São Paulo. São Paulo: Univerversidade de São Paulo, 2007.

  • BALAGE FILHO, P. P. ; PARDO, T. A. S. ; NUNES, M. G. V. . Sumarização Automática de Textos Estruturados. In: 14o. Simpósio Internacional de Iniciação Científica da Universidade de São Paulo, 2006, São Paulo. Anais do 14o. Simpósio Internacional de Iniciação Científica da Universidade de São Paulo. São Paulo: Univerversidade de São Paulo, 2006. p. 1-1.

Prêmios

2011

Intern Day Prize (2º lugar), Xerox Research Centre Europe.

2010

Bolsa ERASMUS MUNDUS para o Mestrado International em Processamento de Linguagem Natural, Programa ERASMUS - União Européia.

2008

Bolsa para realização de Intercâmbio de Estudos, Santander Universidades.

Histórico profissional

Endereço profissional

  • Universidade de São Paulo, Instituto de Ciências Matemáticas e de Computação, Departamento de Ciências da Computação. , Avenida Trabalhador Sancarlense, 400, Centro, 13566590 - São Carlos, SP - Brasil, Telefone: (16) 33739700, Fax: (16) 33712238, URL da Homepage:

Experiência profissional

2013 - 2013

Dicionário Criativo

Vínculo: Colaborador, Enquadramento Funcional: Colaborador, Carga horária: 0

Atividades

  • 02/2013 - 08/2013

    Pesquisa e desenvolvimento , Dicionário Criativo, .,Linhas de pesquisa

2011 - 2011

Xerox Research Centre Europe

Vínculo: Estágio, Enquadramento Funcional: Estagiário, Carga horária: 40, Regime: Dedicação exclusiva.

Outras informações:
Premiado (em segundo lugar) como melhor estágio realizado naquele semestre.

Atividades

  • 05/2011 - 09/2012

    Pesquisa e desenvolvimento , Parsing & Semantics, .,Linhas de pesquisa