ARTHUR LORENZI ALMEIDA

Doutorando em Linguística pela Universidade Federal de Juiz de Fora com período sanduíche na Heinrich-Heine-Universität (Alemanha - PROBRAL). Possui graduação em Sistemas de Informação pela Universidade Federal de Juiz de Fora (2018). Tem experiência na área de Ciência da Computação, com ênfase em Processamento e Geração de Língua Natural, Gramática de Construções e Semântica de Frames.

Informações coletadas do Lattes em 06/09/2025

Acadêmico

Formação acadêmica

Doutorado em andamento em Lingüística

2020 - Atual

Universidade Federal de Juiz de Fora
Título: Constructions and frames for data-to-text Natural Language Generation of Encyclopedia Articles
Orientador: em Heinrich Heine Universität Düsseldorf ( Alexander Ziem)
com Tiago Timponi Torrent. Bolsista do(a): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, CAPES, Brasil. Grande área: Lingüística, Letras e ArtesGrande Área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Geração de linguagem natural.

Graduação em Sistemas de Informação

2013 - 2018

Universidade Federal de Juiz de Fora
Título: DESENVOLVIMENTO DE UM ASSISTENTE PESSOAL DE VIAGEM SOBRE UM MODELO FRAMENET DOS DOMÍNIOS DE TURISMO E ESPORTES
Orientador: Wagner Arbex

Ensino Médio (2º grau)

2010 - 2013

Instituto Federal do Sudeste de Minas Gerais

Idiomas

Bandeira representando o idioma Inglês

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Espanhol

Compreende Razoavelmente, Fala Razoavelmente, Lê Razoavelmente, Escreve Razoavelmente.

Bandeira representando o idioma Português

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Alemão

Compreende Pouco, Fala Pouco, Lê Pouco, Escreve Pouco.

Áreas de atuação

Grande área: Lingüística, Letras e Artes / Área: Lingüística.

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Metodologia e Técnicas da Computação/Especialidade: Banco de Dados.

Grande área: Ciências Agrárias / Área: Zootecnia / Subárea: Bioinformática.

Produções bibliográficas

  • ALMEIDA, A. L. ; SCHETTINO, V. J. ; Barbosa, Thiago ; FREITAS, P. F. ; LAIER, M. H. ; GUIMARAES, P. G. S. ; ARBEX, W. . Relative Scalability of NoSQL Databases for Genotype Data Manipulation. REVISTA DE INFORMÁTICA TEÓRICA E APLICADA: RITA , v. 25, p. 93, 2018.

  • TORRENT, T. T. ; HOFFMANN, T. ; ALMEIDA, A. L. ; TURNER, M. . Copilots for Linguists: AI, Constructions, and Frames. 1. ed. Cambridge: Cambridge University Press, 2023. v. 1. 114p .

  • LORENZI, A. ; ALMEIDA, V. G. ; MATOS, E. E. ; TORRENT, T. T. . Modeling Construction Grammar's Way into NLP: Insights from negative results in automatically identifying schematic clausal constructions in Brazilian Portuguese. In: Claire Bonial; Harish Tayyar Madabushi. (Org.). Proceedings of the First International Workshop on Construction Grammars and NLP (CxGs+NLP, GURT/SyntaxFest 2023). 1ed.Stroudsburg: Association for Computational Linguistic, 2023, v. 1, p. 96-109.

  • TORRENT, T. T. ; LORENZI, A. ; MATOS, E. E. ; BELCAVELLO, F. ; VIRIDIANO, M. ; GAMONAL, M. A. . Lutma: A Frame-Making Tool for Collaborative FrameNet Development. In: Gavin Abercrombie; Valerio Basile; Sara Tonelli; Verena Rieser; Alexandra Uma. (Org.). Proceedings of the LREC 2022 workshop on Perspectivist Approaches to Disagreement in NLP (NLPerspectives). 1ed.Paris: European Language Resources Association (ELRA), 2022, v. 1, p. 100-107.

  • VIRIDIANO, M. ; TORRENT, T. T. ; CZULO, O. ; ALMEIDA, A. L. ; MATOS, E. E. ; BELCAVELLO, F. . The Case for Perspective in Multimodal Datasets. In: Gavin Abercrombie; Valerio Basile; Sara Tonelli; Verena Rieser; Alexandra Uma. (Org.). Proceedings of the LREC 2022 workshop on Perspectivist Approaches to Disagreement in NLP (NLPerspectives). 1ed.Paris: European Language Resources Association (ELRA), 2022, v. 1, p. 108-116.

  • LORENZI, A. ; LJUNGLOF, P. ; LYNGFELT, B. ; TORRENT, T. T. ; CROFT, W. ; ZIEM, A. ; BOBEL, N. ; BACKSTROM, L. ; UHRIG, P. ; MATOS, E. E. . MoCCA: A Model of Comparative Concepts for Aligning Constructicons. In: ISO Workshop on Interoperable Semantic Annotation @ LREC-COLING 2024, 2024, Torino. Proceedings of the 20th Joint ACL - ISO Workshop on Interoperable Semantic Annotation @ LREC-COLING 2024, 2024. p. 93-98.

  • WEISSWEILER, L. ; BOBEL, N. ; GUILLER, K. ; HERRERA, S. ; SCIVETTI, W. ; LORENZI, A. ; MELNIK, N. ; BHATIA, A. ; SCHUTZE, H. ; LEVIN, L. ; ZELDES, A. ; NIVRE, J. ; CROFT, W. ; SCHNEIDER, N. . UCxn: Typologically Informed Annotation of Constructions Atop Universal Dependencies. In: 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), 2024, Torino. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), 2024. p. 16919-16932.

  • VIRIDIANO, M. ; LORENZI, A. ; TORRENT, T. T. ; MATOS, E. E. ; PAGANO, A. S. ; SIGILIANO, N. S. ; GAMONAL, M. A. ; ABREU, H. A. ; DUTRA, L. V. ; SAMAGAIO, M. M. ; CARVALHO, M. ; CAMPOS, F. ; AZALIM, G. ; MAZZEI, B. ; OLIVEIRA, M. F. ; LUZ, A. C. ; RUIZ, L. P. ; BELLEI, J. ; PESTANA, A. ; COSTA, J. ; et.al . Framed Multi30K: A Frame-Based Multimodal-Multilingual Dataset. In: 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), 2024, Torino. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), 2024. p. 7438-7449.

  • SAMAGAIO, M. M. ; TORRENT, T. T. ; MATOS, E. E. ; LORENZI, A. . Semantic Permanence in Audiovisual Translation: a FrameNet approach to subtitling. In: 16th International Conference on Computational Processing of Portuguese (PROPOR 2024), 2024, Santiago de Compostela. Proceedings of the 16th International Conference on Computational Processing of Portuguese - Vol. 1, 2024. p. 168-176.

  • GAMONAL, M. A. ; PAGANO, A. S. ; TORRENT, T. T. ; MATOS, E. E. ; LORENZI, A. . Automated Semantic Frame Annotation ? An Exploratory Study in the Health Domain. In: XXI EURALEX International Congress, 2024, Cavtat. Lexicography and Semantics. Proceedings of the XXI EURALEX International Congress, 2024. p. 67-81.

  • DUTRA, L. ; LORENZI, A. ; TARRE, L. T. ; BELCAVELLO, F. ; MATOS, E. E. ; PESTANA, A. ; BROWN, K. ; GONCALVES, M. ; HERBST, V. ; REINACH, S. ; TEIXEIRA, R. ; PAULA, P. ; PELLINI, A. ; SEQUEIRA, C. ; SABINO, E. ; LEAL, F. ; CONDE, M. ; GRESPAN, R. ; TORRENT, T. T. . Building a Frame-Semantic Model of the Healthcare Domain: Towards the identification of gender-based violence in public health data. In: Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, 2023, Belo Horizonte. ANAIS DO XIV SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA. Porto Alegre: SBC, 2023. v. 1. p. 346-354.

  • BAKER, COLLIN F. ; ELLSWORTH, MICHAEL ; PETRUCK, MIRIAM R. L. ; LORENZI, ARTHUR . Comparing Distributional and Curated Approaches for Cross-lingual Frame Alignment. In: Proceedings of the Workshop on Dimensions of Meaning: Distributional and Curated Semantics (DistCurate 2022), 2022, Seattle. Proceedings of the Workshop on Dimensions of Meaning: Distributional and Curated Semantics (DistCurate 2022). Stroudsburg: Association for Computational Linguistics, 2022. p. 24.

  • BAKER, C. F. ; ALMEIDA, A. L. . Exploring Crosslinguistic Frame Alignment. In: International FrameNet Workshop 2020, 2020, Marseille. Proceedings of the International FrameNet Workshop 2020: Towards a Global, Multilingual FrameNet. Paris: European Language Resources Association, 2020. p. 77-84.

  • LORENZI, A. . Semântica de Frames e IA: Teoria, Interseções e Práticas para Pesquisa. 2024. (Apresentação de Trabalho/Outra).

  • LORENZI, A. . IAs conversacionais para pesquisa em Gramática de Construções. 2024. (Apresentação de Trabalho/Outra).

  • TORRENT, T. T. ; TURNER, M. ; LORENZI, A. . Copilots for frame semanticists. 2023. (Apresentação de Trabalho/Comunicação).

  • TORRENT, T. T. ; MATOS, E. E. ; GAMONAL, M. A. ; BELCAVELLO, F. ; VIRIDIANO, M. ; ALMEIDA, A. L. . Lutma: a frame-maker tool. 2021. (Apresentação de Trabalho/Conferência ou palestra).

  • ALMEIDA, A. L. ; BAKER, C. F. . Exploring Semantic Frame Relations across Languages. 2021. (Apresentação de Trabalho/Conferência ou palestra).

Projetos de desenvolvimento

  • 2020 - 2021

    Lutma: Uma ferramenta para construção de frames, Descrição: Este projeto pretende desenvolver, através de parceria com o Red Hen Lab e de financiamento da Alexander von Humboldt Foundation, uma ferramenta de software para criar novos frames no padrão FrameNet em um método passo-a-passo, parcialmente restrito e dependente de um conhecimento teórico mínimo. Além da ferramenta, serão fornecidos tutoriais escritos e em vídeo, preparados por especialistas em criação de frames. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Arthur Lorenzi Almeida - Integrante / Tiago Timponi Torrent - Coordenador / Ely Edison Matos - Integrante / Maucha Andrade Gamonal - Integrante / Frederico Belcavello - Integrante / Marcelo Viridiano - Integrante., Financiador(es): Alexander Von Humboldt-Stiftung/Foundation - Bolsa.

  • 2023 - Atual

    Leveraging data linkage and frame-based textual analysis for the identification of candidate cases prone to suffer from GBV in territories, Projeto certificado pelo(a) coordenador(a) Tiago Timponi Torrent em 20/09/2023., Descrição: According to the World Health Organization, one in three women has been a victim of physical or sexual violence by their partner at some point in their lives. In Brazil, the notification of a violence case is mandatory. The health professionals must register it in the notifiable diseases information system (SINAN). The literature already described that most women do not seek health services when they experience violence. However, even when they do, health professionals face challenges notifying the cases for different reasons. Some issues the Brazilian health teams usually find are lack of knowledge about the notification process and importance, lack of time in overburdened work routines, fear of possible retaliation by the aggressors, and, finally, difficulties identifying that the injuries and other health conditions are related to a violent episode. This project aims to deal, more specifically, with the last case. Our hypothesis is that data present in medical records, when linked to those in other databases and properly analyzed for their semantic content, can contribute to the identification of augmented risk of gender-based violence (GBV) at a given territory. In this project, we will use data integration and textual analysis to identify patterns that suggest that women registered in the health systems are victims of violence. Identification of patterns of GBV will be treated at the level of the territories where candidate victims live, and the resulting system will not keep present information on individuals. Hence, the main goal is to better equip policy makers, local authorities and health teams acting on said territories to design and apply public policies for both raising awareness and eventually reducing GBV in the territories.. , Situação: Em andamento; Natureza: Desenvolvimento. , Alunos envolvidos: Graduação: (4) / Mestrado acadêmico: (1) . , Integrantes: Arthur Lorenzi Almeida - Integrante / Tiago Timponi Torrent - Coordenador / Ely Edison Matos - Integrante / Frederico Belcavello - Integrante / Lívia Vicente Dutra - Integrante / Sofia S Reinach - Integrante / Renato Teixeira - Integrante / Pedro do Carmo Baumgratz de Paula - Integrante.

  • 2022 - Atual

    ReINVenTA - Research and Innovation Network for Video and Text Analysis of Multimodal Objects, Projeto certificado pelo(a) coordenador(a) Tiago Timponi Torrent em 20/09/2023., Descrição: Esta proposta visa estabelecer uma rede mineira de pesquisa em processamento semântico computacional de objetos multimodais (i.e. compostos de modos comunicativos como linguagem verbal, gestos, vídeo que interagem para a produção de sentido). Para tanto, mobiliza laboratórios e grupos de pesquisa da UFJF, UFMG, UFU e PUC-MG com expertise em Desenvolvimento de Modelos para Compreensão de Língua Natural, Inteligência Artificial, Descoberta de Conhecimento e Tecnologias Assistivas. Mais especificamente, a rede ReINVenTA se constitui para investigar aplicações do modelo semântico-computacional da FrameNet à representação semântica de objetos multimodais. O plano de ação proposto se baseia na confluência de três projetos de pesquisa. O primeiro, "Representação semântica computacional de objetos multimodais: aliando visão computacional e compreensão de língua natural através da Semântica de Frames", projeto interinstitucional norteador (UFJF/UFMG/UFU), congrega os objetivos comuns dos grupos da rede. Somam-se a ele os projetos de produtividade em pesquisa do coordenador e da subcoordenadora: (a) "Reenquadrando Modelos de Língua: por uma FrameNet multilíngue, multimodal e multicêntrica" e (b) "Construção do domínio experiencial na produção textual em ambiente multilíngue". A confluência de expertises e projetos, galvanizada pela experiência da equipe da PUC-MG em descoberta de conhecimento, resultará em: (i) a expansão da cobertura do modelo da FrameNet para o português brasileiro; (ii) a constituição de um gold standard dataset de objetos multimodais anotados semanticamente e validado psicolinguisticamente; (iii) o desenvolvimento de algoritmos de inteligência artificial para rotulação automática e descoberta de conhecimento em objetos multimodais e (iv) a proposição de melhores práticas para a audiodescrição de vídeos. A colaboração potencializará a infraestrutura instalada dos laboratórios, bem como sua produção técnica e formação de recursos humanos..Situação: Em andamento; Natureza: Desenvolvimento.. , Situação: Em andamento; Natureza: Desenvolvimento. , Integrantes: Arthur Lorenzi Almeida - Integrante / Tiago Timponi Torrent - Coordenador / Ely Edison Matos - Integrante / Maucha Andrade Gamonal - Integrante / Frederico Belcavello - Integrante / Lívia Vicente Dutra - Integrante / Natália Sathler Sigiliano - Integrante / Fernanda Cláudia Alves Campos - Integrante / Regina Maria Maciel Braga - Integrante / Aline Alves Fonseca - Integrante / José Maria David - Integrante / Marcelo Barros Custódio - Integrante / Adriana Silvina Pagano - Integrante / André Vinícius Lopes Coneglian - Integrante / Evandro Landulfo Teixeira Paradela Cunha - Integrante / Fábio Alves da Silva Júnior - Integrante / Flávia Afonso Mayer - Integrante / Igor Antônio Lourenço da Silva - Integrante / Kícila Ferreguetti de Oliveira - Integrante / Thiago Castro Ferreira - Integrante / Victor Ströele de Andrade Menezes - Integrante / Marcelo Ferreira Moreno - Integrante / Wagner Meira - Integrante / Wladmir Cardoso Brandão - Integrante / Mairon Morelli Samagaio - Integrante / Letícia Grossi Dornelas - Integrante / Débora Soares de Souza - Integrante / Júlia Bellei Xavier - Integrante.

  • 2020 - 2021

    Lutma: Uma ferramenta para construção de frames, Descrição: Este projeto pretende desenvolver, através de parceria com o Red Hen Lab e de financiamento da Alexander von Humboldt Foundation, uma ferramenta de software para criar novos frames no padrão FrameNet em um método passo-a-passo, parcialmente restrito e dependente de um conhecimento teórico mínimo. Além da ferramenta, serão fornecidos tutoriais escritos e em vídeo, preparados por especialistas em criação de frames. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Arthur Lorenzi Almeida - Integrante / Tiago Timponi Torrent - Coordenador / Ely Edison Matos - Integrante / Maucha Andrade Gamonal - Integrante / Frederico Belcavello - Integrante / Marcelo Viridiano - Integrante., Financiador(es): Alexander Von Humboldt-Stiftung/Foundation - Bolsa.

Histórico profissional

Experiência profissional

2020 - Atual

Universidade Federal de Juiz de Fora

Vínculo: Bolsista, Enquadramento Funcional: Pesquisador de Doutorado

2019 - 2020

International Computer Science Institute

Vínculo: Outro, Enquadramento Funcional: Visiting Researcher, Carga horária: 40, Regime: Dedicação exclusiva.

2022 - 2023

Heinrich Heine Universität Düsseldorf

Vínculo: Bolsista, Enquadramento Funcional: Visiting Student Researcher, Carga horária: 20

2025 - Atual

Vital Strategies Brasil

Vínculo: Celetista, Enquadramento Funcional: Ass. Técnico Dados, Tecnologia e Linguistica