Elvis Alves de Souza

Pesquisador em projetos no campo do Processamento de Linguagem Natural (NLP) e Inteligência Artificial no Laboratório de Inteligência Computacional Aplicada da PUC-Rio (ICA/PUC-Rio). Doutorando em Ciências de Computação e Matemática Computacional (ICMC/USP), mestre em Estudos da Linguagem (PPGEL/PUC-Rio) e bacharel em Letras (PUC-Rio). Interessado em Processamento de Linguagem Natural, Linguística Computacional, Humanidades Digitais e estudos linguísticos descritivos baseados em corpus.

Informações coletadas do Lattes em 20/04/2025

Acadêmico

Formação acadêmica

Doutorado em andamento em Ciências da Computação e Matemática Computacional

2024 - Atual

Universidade de São Paulo
Título: Enhanced Dependencies para português: uma investigação sobre métodos computacionais para a anotação das dependências sintáticas enhanced do projeto Universal Dependencies
Thiago Alexandre Salgueiro Pardo. Grande área: Ciências Exatas e da Terra

Mestrado em ESTUDOS DA LINGUAGEM

2021 - 2023

Pontifícia Universidade Católica do Rio de Janeiro, PUC-Rio
Título: Construção e avaliação de um treebank padrão ouro, Ano de Obtenção: 2023
Maria Cláudia de Freitas.Bolsista do(a): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ, FAPERJ, Brasil. Palavras-chave: processamento de linguagem natural; linguística computacional; treebanks; anotação de corpus; descrição do português; aprendizado de máquina.

Especialização em andamento em BI MASTER - Sistemas Inteligentes de Apoio à Decisão em Negócios

2023 - Atual

Pontifícia Universidade Católica do Rio de Janeiro, PUC-Rio

Graduação em Letras - Inglês

2017 - 2020

Pontifícia Universidade Católica do Rio de Janeiro, PUC-Rio
Título: Bastidores linguísticos e computacionais da construção de um dataset linguístico
Orientador: Maria Cláudia de Freitas
Bolsista do(a): Programa Universidade Para Todos, PROUNI, Brasil.

Ensino Médio (2º grau)

2014 - 2016

Colégio de São Bento

Formação complementar

2021 - 2021

Extensão universitária em Python para Processamento de Linguagem Natural. (Carga horária: 20h). , Universidade de São Paulo, USP, Brasil.

2020 - 2020

Formação em processamento de corpos, PLN, anotação, e estatística. (Carga horária: 20h). , University of Oslo, UiO, Noruega.

2019 - 2019

Extensão universitária em IA II - INTELIGÊNCIA ARTIFICIAL II. (Carga horária: 45h). , Pontifícia Universidade Católica do Rio de Janeiro, PUC-Rio, Brasil.

2019 - 2019

Extensão universitária em IA I - INTELIGÊNCIA ARTIFICIAL I. (Carga horária: 45h). , Pontifícia Universidade Católica do Rio de Janeiro, PUC-Rio, Brasil.

Idiomas

Bandeira representando o idioma Inglês

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Espanhol

Compreende Bem, Fala Razoavelmente, Lê Bem, Escreve Pouco.

Bandeira representando o idioma Português

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Francês

Compreende Razoavelmente, Fala Pouco, Lê Bem, Escreve Razoavelmente.

Áreas de atuação

Grande área: Lingüística, Letras e Artes / Área: Lingüística / Subárea: Processamento de Linguagem Natural / Linguística Computacional.

Grande área: Lingüística, Letras e Artes / Área: Lingüística / Subárea: Linguística com corpus.

Grande área: Lingüística, Letras e Artes / Área: Lingüística / Subárea: Língua Portuguesa.

Grande área: Lingüística, Letras e Artes / Área: Lingüística / Subárea: Educação.

Participação em eventos

Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana.Automatic Annotation of Enhanced Universal Dependencies for Brazilian Portuguese. 2024. (Simpósio).

SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL).Explorando variações no tagset e na anotação Universal Dependencies (UD) para Português: Possibilidades e resultados com base no treebank PetroGold. 2023. (Simpósio).

Conferência Internacional de Processamento Computacional da Língua Portuguesa ―a. 2022. (Congresso).

Universal Dependencies Brazilian Festival. Polishing the gold ? how much revision do we need in treebanks?. 2022. (Congresso).

Conference on Empirical Methods in Natural Language Processing. ET: A Workstation for Querying, Editing and Evaluating Annotated Corpora. 2021. (Congresso).

II Congresso Internacional de Humanidades Digitais. Identificação automática de gênero morfológico em personagens literários: comparação entre duas ferramentas. 2021. (Congresso).

SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 13.. PetroGold ? Corpus padrão ouro para o domínio do petróleo. 2021. (Congresso).

XXVIII Seminário de Iniciação Científica e Tecnológica da PUC-Rio.GRAMÁTICAS EM DISCUSSÃO: O CASO DAS LOCUÇÕES VERBAIS. 2020. (Seminário).

II JILAC - Jornada Internacional de Linguística Aplicada Crítica. 2019. (Congresso).

VI Jornada de Descrição do Português. (Re)começando a discutir as locuções verbais. 2019. (Congresso).

VI Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana.ET: uma Estação de Trabalho para revisão, edição e avaliação de corpora anotados morfossintaticamente. 2019. (Oficina).

XXVII Seminário de Iniciação Científica e Tecnológica da PUC-Rio.ET: uma Estação de Trabalho para revisão, edição e avaliação de corpora anotados morfossintaticamente. 2019. (Seminário).

I HDRio - Congresso Internacional em Humanidades Digitais. 2018. (Congresso).

II CONELP - Congresso Internacional de Ensino de Língua Portuguesa. Grandes corpora em sala de aula: como a Linguateca e o Ensinador podem contribuir com o trabalho do professor de Língua Portuguesa?. 2018. (Congresso).

Semana de Letras PUC-Rio.Como e por que abordar gramática no ensino fundamental?. 2018. (Seminário).

V Encontro Institucional do PIBID.O PIBID NA E.M. SÃO TOMÁS DE AQUINO. 2017. (Encontro).

VI SILID - Simpósio sobre o Livro Didático de Língua Materna e Estrangeira. 2017. (Congresso).

Produções bibliográficas

  • CORDEIRO, FÁBIO CORRÊA ; DA SILVA, PATRÍCIA FERREIRA ; TESSAROLLO, ALEXANDRE ; FREITAS, CLÁUDIA ; DE SOUZA, Elvis ; DA SILVA MAGALHAES GOMES, DIOGO ; SOUZA, RENATO ROCHA ; COELHO, FLÁVIO CODEÇO . Petro NLP: Resources for natural language processing and information extraction for the oil and gas industry. COMPUTERS & GEOSCIENCES , v. 193, p. 105714, 2024.

  • DE SOUZA, Elvis ; FREITAS, MARIA CLÁUDIA . Avaliação da anotação automática de dependências sintáticas. REVISTA DA ABRALIN , v. 22, p. 308-331, 2024.

  • FREITAS, CLÁUDIA ; DE SOUZA, Elvis . A study on methods for revising dependency treebanks: in search of gold. Language Resources and Evaluation , v. 2023, p. 1, 2023.

  • FREITAS, CLÁUDIA ; SOUSA, ELVIS ; CASTRO, MARIA CLARA ; CAVALCANTI, TATIANA ; FERREIRA DA SILVA, PATRICIA ; CORRÊA CORDEIRO, FÁBIO . Recursos linguísticos para o PLN específico de domínio: o Petrolês. LINGUAMÁTICA (BRAGA) , v. 15, p. 51-68, 2023.

  • FREITAS, CLÁUDIA ; SOUZA, ELVIS DE . Sujeito oculto às claras: uma abordagem descritivo-computacional / Omitted subjects revealed: a quantitative-descriptive approach. Revista de Estudos da Linguagem , v. 29, p. 1033-1058, 2021.

  • CAVALCANTI, T. S. H. ; SILVEIRA, A. ; DE SOUZA, Elvis ; FREITAS, C. . Os limites da palavra e da sentença no processamento automático de textos. REVISTA BRASILEIRA DE INICIAÇÃO CIENTÍFICA , v. 8, p. 1-21, 2021.

  • KHALLAF, N. ; DE SOUZA, E. ; EL-HAJ, M. ; RAYSON, P. . Semantic domains across topics, genders and languages. In: David M. Palfreyman, Nizar Habash. (Org.). Bilingual Writers and Corpus Analysis. 1ed.Abingdon: Routledge, 2022, v. 1, p. 96-120.

  • SOUZA, ELVIS A. DE ; DURAN, MAGALI SANCHES ; PAGANO, ADRIANA S. . An NLP approach to impersonal -se in Brazilian Portuguese. In: Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, 2024, Brasil. Anais do XV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2024), 2024. p. 346.

  • NAVARRO, LAURA P. ; SOUZA, ELVIS A. DE ; PACHECO, MARCO A. C. . Text extraction from Knowledge Graphs in the Oil and Gas Industry. In: Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, 2024, Brasil. Anais do XV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2024), 2024. p. 524.

  • SOUZA, ELVIS A. DE ; SILVA, PATRICIA F. DA ; GOMES, DIOGO ; BATISTA, VITOR ; BATISTA, EVELYN ; PACHECO, MARCO . TableRAG: A Novel Approach for Augmenting LLMs with Information from Retrieved Tables. In: Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, 2024, Brasil. Anais do XV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2024), 2024. p. 182.

  • DE SOUZA, ELVIS A. ; DURAN, MAGALI S. ; NUNES, MARIA DAS GRAÇAS V. ; SAMPAIO, GUSTAVO ; BELASCO, GIOVANNA ; PARDO, THIAGO A. S. . Automatic Annotation of Enhanced Universal Dependencies for Brazilian Portuguese. In: Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, 2024, Brasil. Anais do XV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2024), 2024. p. 217.

  • DE SOUZA, Elvis ; FREITAS, CLÁUDIA . Explorando variações no tagset e na anotação Universal Dependencies (UD) para Português: Possibilidades e resultados com base no treebank PetroGold. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 2023, Belo Horizonte. Anais do SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 2023. p. 125-134.

  • DE SOUZA, Elvis ; FREITAS, CLÁUDIA . Um pronome com muitas funções: Descrição e resultados da anotação do pronome -se em um treebank segundo o esquema Universal Dependencies (UD) para Português. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 2023, Belo Horizonte. Anais do SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 2023. p. 278-287.

  • DE SOUZA, Elvis ; FREITAS, CLÁUDIA . Annotation of fixed Multiword Expressions (MWEs) in a Portuguese Universal Dependencies (UD) treebank: Gathering candidates from three different sources. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 2023, Belo Horizonte. Anais do SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 2023. p. 442-450.

  • EL-HAJ, M. ; RAYSON, P. ; DE SOUZA, E. ; KHALLAF, N. ; HABASH, N. . AraSAS: The Open Source Arabic Semantic Tagger. In: 5th Workshop on Open-Source Arabic Corpora and Processing Tools with Shared Tasks on Qur'an QA and Fine-Grained Hate Speech Detection, 2022, Marseille. Proceedings [...], 2022. p. 23-31.

  • DE SOUZA, Elvis ; FREITAS, C. . Polishing the gold ? how much revision do we need in treebanks?. In: Universal Dependencies Brazilian Festival, 2022, Fortaleza. Proceedings [...], 2022.

  • DE SOUZA, Elvis ; FREITAS, C. . Still on arguments and adjuncts: the status of the indirect object and the adverbial adjunct relations in Universal Dependencies for Portuguese. In: Universal Dependencies Brazilian Festival, 2022, Fortaleza. Proceedings [...], 2022.

  • SOUZA, ELVIS DE ; SILVEIRA, ALINE ; CAVALCANTI, TATIANA ; CASTRO, MARIA CLARA ; FREITAS, CLÁUDIA . PetroGold - Corpus padrão ouro para o domínio do petróleo. In: Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, 2021, Brasil. Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021), 2021. p. 29.

  • DE SOUZA, Elvis ; FREITAS, C. . ET: A Workstation for Querying, Editing and Evaluating Annotated Corpora. In: 2021 Conference on Empirical Methods in Natural Language Processing: System Demonstrations, 2021, Online and in Punta Cana. Proceedings [...], 2021.

  • DE SOUZA, Elvis ; FREITAS, C. . (Re)começando a discutir as locuções verbais. In: XII Symposium in Information and Human Language Technology and Collocates Events, 2019, Salvador. Proceedings [...], 2019.

  • DE SOUZA, Elvis ; FREITAS, C. . ET: uma Estação de Trabalho para revisão, edição e avaliação de corpora anotados morfossintaticamente. In: XII Symposium in Information and Human Language Technology and Collocates Events, 2019, Salvador. Proceedings [...], 2019.

  • SILVEIRA, A. ; DE SOUZA, E. ; CAVALCANTI, T. S. H. ; FREITAS, C. . Do PDF ao TXT: Desafios na extração de informação em textos técnico-científicos. In: XII Symposium in Information and Human Language Technology and Collocates Events, 2019, Salvador. Proceedings [...], 2019.

  • FREITAS, C. ; DE SOUZA, Elvis ; ROCHA, L. S. . Quantificando (e qualificando) o sujeito oculto em português. In: XII Symposium in Information and Human Language Technology and Collocates Events, 2019, Salvador. Proceedings [...], 2019.

  • NAVARRO, LAURA P. ; DE SOUZA, E. ; PACHECO, MARCO A. C. . Text extraction from Knowledge Graphs in the Oil and Gas Industry. 2024. (Apresentação de Trabalho/Simpósio).

  • DE SOUZA, E. ; SILVA, PATRICIA F. DA ; GOMES, DIOGO ; BATISTA, VITOR ; BATISTA, EVELYN ; PACHECO, MARCO . TableRAG: A Novel Approach for Augmenting LLMs with Information from Retrieved Tables. 2024. (Apresentação de Trabalho/Simpósio).

  • DE SOUZA, E. ; DURAN, MAGALI S. ; NUNES, MARIA DAS GRAÇAS V. ; SAMPAIO, GUSTAVO ; BELASCO, GIOVANNA ; PARDO, THIAGO A. S. . Automatic Annotation of Enhanced Universal Dependencies for Brazilian Portuguese. 2024. (Apresentação de Trabalho/Simpósio).

  • DE SOUZA, E. . Construção e avaliação de um treebank padrão ouro na prática: Um panorama sobre as ferramentas utilizadas e os resultados obtidos no desenvolvimento do PetroGold. 2023. (Apresentação de Trabalho/Conferência ou palestra).

  • DE SOUZA, Elvis ; FREITAS, CLÁUDIA . Explorando variações no tagset e na anotação Universal Dependencies (UD) para Português: Possibilidades e resultados com base no treebank PetroGold. 2023. (Apresentação de Trabalho/Congresso).

  • DE SOUZA, Elvis ; FREITAS, CLÁUDIA . Um pronome com muitas funções: Descrição e resultados da anotação do pronome -se em um treebank segundo o esquema Universal Dependencies (UD) para Português. 2023. (Apresentação de Trabalho/Congresso).

  • DE SOUZA, Elvis ; FREITAS, CLÁUDIA . Annotation of fixed Multiword Expressions (MWEs) in a Portuguese Universal Dependencies (UD) treebank: Gathering candidates from three different sources. 2023. (Apresentação de Trabalho/Congresso).

  • DE SOUZA, Elvis . Recursos linguísticos e computacionais para o Processamento de Linguagem Natural. 2023. (Apresentação de Trabalho/Conferência ou palestra).

  • DE SOUZA, Elvis . Construção de datasets linguísticos: por onde começar?. 2023. (Apresentação de Trabalho/Conferência ou palestra).

  • DE SOUZA, Elvis ; FREITAS, C. . Polishing the gold ? how much revision do we need in treebanks?. 2022. (Apresentação de Trabalho/Comunicação).

  • DE SOUZA, Elvis ; FREITAS, C. . Still on arguments and adjuncts: the status of the indirect object and the adverbial adjunct relations in Universal Dependencies for Portuguese. 2022. (Apresentação de Trabalho/Comunicação).

  • DE SOUZA, E. ; FREITAS, C. . Identificação automática de gênero morfológico em personagens literários: comparação entre duas ferramentas. 2021. (Apresentação de Trabalho/Comunicação).

  • DE SOUZA, Elvis ; FREITAS, C. . ET: A Workstation for Querying, Editing and Evaluating Annotated Corpora. 2021. (Apresentação de Trabalho/Congresso).

  • DE SOUZA, E. ; SILVEIRA, A. ; CAVALCANTI, T. S. H. ; SILVA, M. C. C. ; FREITAS, C. . PetroGold ? Corpus padrão ouro para o domínio do petróleo. 2021. (Apresentação de Trabalho/Congresso).

  • DE SOUZA, E. ; FREITAS, C. . GRAMÁTICAS EM DISCUSSÃO: O CASO DAS LOCUÇÕES VERBAIS. 2020. (Apresentação de Trabalho/Seminário).

  • SILVEIRA, A. ; CAVALCANTI, T. ; DE SOUZA, E. ; FREITAS, C. . O LIMITE DA PALAVRA E DA SENTENÇA: A IMPORTÂNCIA DO TEXTO BEM TOKENIZADO E SENTENCIADO. 2020. (Apresentação de Trabalho/Seminário).

  • SILVEIRA, A. ; CAVALCANTI, T. ; DE SOUZA, E. ; FREITAS, C. . Do PDF ao TXT: Desafios na extração de informação em textos técnico-científicos. 2019. (Apresentação de Trabalho/Seminário).

  • DE SOUZA, E. ; FREITAS, C. . ET: uma Estação de Trabalho para revisão, edição e avaliação de corpora anotados morfossintaticamente. 2019. (Apresentação de Trabalho/Seminário).

  • SILVEIRA, A. ; CAVALCANTI, T. ; DE SOUZA, E. ; FREITAS, C. . Do PDF ao TXT: Desafios na extração de informação em textos técnico-científicos. 2019. (Apresentação de Trabalho/Congresso).

  • DE SOUZA, E. ; FREITAS, C. . ET: uma Estação de Trabalho para revisão, edição e avaliação de corpora anotados morfossintaticamente. 2019. (Apresentação de Trabalho/Congresso).

  • DE SOUZA, E. ; FREITAS, C. . (Re)começando a discutir as locuções verbais. 2019. (Apresentação de Trabalho/Congresso).

  • DE SOUZA, Elvis ; SILVEIRA, A. . Como e por que abordar gramática no ensino fundamental?. 2018. (Apresentação de Trabalho/Comunicação).

  • DE SOUZA, Elvis ; SILVEIRA, A. ; ALBUQUERQUE, Ana Carolina ; FREITAS, C. . Como trazer o dia a dia para a sala de aula valorizando o conhecimento prévio dos alunos sobre as classes gramaticais?. 2018. (Apresentação de Trabalho/Comunicação).

  • DE SOUZA, Elvis ; FREITAS, C. . Grandes corpora em sala de aula: como a Linguateca e o Ensinador podem contribuir com o trabalho do professor de Língua Portuguesa?. 2018. (Apresentação de Trabalho/Comunicação).

  • DE SOUZA, E. ; SILVEIRA, A. . O PIBID NA E.M. SÃO TOMÁS DE AQUINO. 2017. (Apresentação de Trabalho/Outra).

Outras produções

DE SOUZA, Elvis . Parecer para a revista Letras, da UFSM, Edição Especial - 1/2023: O falante, o linguista e uma antropologia na linguagem: uma homenagem ao Professor Valdir do Nascimento Flores. 2023.

DE SOUZA, E. ; SILVEIRA, A. ; CAVALCANTI, T. ; Evelyn, W. ; FREITAS, C. . Diretivas e documentação de anotação UD em português (e para língua portuguesa). 2020. (Desenvolvimento de material didático ou instrucional - Documentação de anotação linguística).

DE SOUZA, Elvis ; FREITAS, C. . Bastidores linguísticos e computacionais da construção de um dataset linguístico. 2020. (Relatório de pesquisa).

DE SOUZA, Elvis ; FREITAS, C. . Relatório anual (2018-2019) do projeto 'Construção de datasets para o PLN de língua portuguesa'. 2019. (Relatório de pesquisa).

DE SOUZA, Elvis . Sobre a utilização do UDPipe - Parser do Universal Dependencies. 2018. (Relatório de pesquisa).

ROCHA, L. S. ; DE SOUZA, E. . Relatório da pesquisa de Sujeito Oculto no corpus Bosque e os desafios para PLN. 2018. (Relatório de pesquisa).

DE SOUZA, Elvis ; ROCHA, L. S. . Relatório sobre o impacto da correção de part-of-speech no corpus Bosque. 2018. (Relatório de pesquisa).

Projetos de pesquisa

  • 2019 - 2021

    BIG Oil - NLP, Projeto certificado pelo(a) coordenador(a) Maria Cláudia de Freitas em 13/03/2021., Descrição: O projeto BigOil-NLP é o resultado de uma parceria de pesquisa e desenvolvimento, entre a Petrobras, o Laboratório ICA (Inteligência Computacional Aplicada - Departamento de Engenharia da PUC-Rio), e o Departamento de Letras da PUC-Rio, que teve início em 2019. O projeto consiste na criação de um corpus anotado, multicamadas, cuja intenção é se tornar um material de referência para o PLN de língua portuguesa, tendo vista especialmente, mas não exclusivamente, aplicações vinculadas à extração de informação na área de óleo gás.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (3) / Mestrado acadêmico: (1) / Doutorado: (0) . , Integrantes: Elvis Alves de Souza - Integrante / Aline Silveira - Integrante / Maria Cláudia de Freitas - Coordenador / Tatiana Cavalcanti - Integrante / Maria Clara Castro da Silva - Integrante., Número de produções C, T & A: 2

  • 2019 - 2020

    Recursos linguísticos para o PLN da língua portuguesa, Projeto certificado pelo(a) coordenador(a) Maria Cláudia de Freitas em 20/04/2019., Descrição: O projeto pretende investigar pontos de diálogo entre abordagens simbólicas e estatísticas tomando como ponto de partida a construção de datasets linguísticos / recursos corpora anotados. Adicionalmente, o projeto toma por base a língua portuguesa, partindo do princípio de que abordagens podem ser independentes de língua, mas recursos linguísticos, não. Como contribuições do projeto, prevê-se a melhoria de recursos linguísticos para o PLN, tendo como objetivo final enriquecer as possibilidades de exploração das Humanidades Digitais em língua portuguesa. Quanto ao enquadramento teórico, o projeto assume uma visão de língua compatível com o ângulo sugerido por Wittgenstein (1953).. , Situação: Concluído; Natureza: Pesquisa. , Integrantes: Elvis Alves de Souza - Integrante / Maria Cláudia de Freitas - Coordenador., Número de produções C, T & A: 13

Prêmios

2024

Best Paper Award do STIL, Sociedade Brasileira de Computação.

2016

Protagonista, ISMART (Instituto Social para Motivar, Apoiar e Reconhecer Talentos).

2014

Protagonista, ISMART (Instituto Social para Motivar, Apoiar e Reconhecer Talentos).

Histórico profissional

Experiência profissional

2023 - Atual

Pontifícia Universidade Católica do Rio de Janeiro, PUC-Rio

Vínculo: Celetista, Enquadramento Funcional: Especialista em IA, Carga horária: 40

Outras informações:
Pesquisador e desenvolvedor no Laboratório de Inteligência Computacional Aplicada da PUC-Rio

2021 - 2023

Pontifícia Universidade Católica do Rio de Janeiro, PUC-Rio

Vínculo: Bolsista, Enquadramento Funcional: Bolsista de mestrado, Carga horária: 40, Regime: Dedicação exclusiva.

Outras informações:
Bolsista de mestrado do Programa de Pós-Graduação em Estudos da Linguagem (PUC-Rio) em projeto na área do PLN (processamento de linguagem natural) vinculado ao ICA (Laboratório de Inteligência Computacional Aplicada) da PUC-Rio.

Atividades

  • 04/2019

    Pesquisa e desenvolvimento, Laboratório de Inteligência Computacional Aplicada.,Linhas de pesquisa

  • 03/2019 - 07/2020

    Pesquisa e desenvolvimento, Departamento de Letras.,Linhas de pesquisa

  • 03/2018 - 03/2019

    Estágios , Núcleo de Inovação Tecnológica.,Estágio realizado, Desenvolvimento de produto dentro do projeto Voice financiado pelo Banco BTG Pactual.

  • 03/2018 - 12/2018

    Extensão universitária , Núcleo de Orientação e Apoio Psicopedagógico.,Atividade de extensão realizada, Participação na Equipe de Leitura e Escrita do NOAP, auxiliando alunos da universidade com dificuldades acadêmicas.

2020 - 2020

Lancaster University

Vínculo: Assistente de pesquisa, Enquadramento Funcional: Assistente de pesquisa, Carga horária: 8

Outras informações:
Desenvolvimento de sistema de anotação semântica de textos em árabe utilizando Python. Trata-se da versão em árabe do USAS - UCREL Semantic Analysis System. O projeto se desenvolveu em parceria com as Zayed University e New York Abu Dhabi University.