Caroline Varaschin Gasperin

Possui graduação em Informática pela Pontifícia Universidade Católica do Rio Grande do Sul (1999), mestrado em Ciência da Computação pela Pontifícia Universidade Católica do Rio Grande do Sul (2001) e doutorado em Ciência da Computação pela University of Cambridge (2008). Tem experiência na área de Processamento da Linguagem Natural, atuando principalmente nos seguintes temas: métodos baseados em corpora para processamento da linguagem, aquisição léxica automática, resolução de anáforas e anotação de corpora.

Informações coletadas do Lattes em 29/10/2022

Acadêmico

Formação acadêmica

Doutorado em Computer Science

2003 - 2008

University Of Cambridge
Título: Statistical Anaphora Resolution in Biomedical Texts
Orientador: Edward John Briscoe
Bolsista do(a): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior. Palavras-chave: Processamento da Linguagem Natural; Resolução de anáforas; Anotação de corpora; Métodos estatísticos.Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação. Grande Área: Lingüística, Letras e Artes / Área: Lingüística.

Mestrado em Ciência da Computação

2000 - 2001

Pontifícia Universidade Católica do Rio Grande do Sul
Orientador: Vera Lúcia Strube de Lima
Bolsista do(a): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior. Palavras-chave: relações semânticas; corpus; thesaurus.Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Inteligencia Artificial / Especialidade: Processamento da Linguagem Natural. Setores de atividade: Informática.

Graduação em Informática

1996 - 1999

Pontifícia Universidade Católica do Rio Grande do Sul

Pós-doutorado

2009 - 2010

Pós-Doutorado. , Universidade de São Paulo, USP, Brasil. , Bolsista do(a): Fundação de Amparo à Pesquisa do Estado de São Paulo. , Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Inteligencia Artificial / Especialidade: Processamento da Linguagem Natural.

Idiomas

Bandeira representando o idioma Inglês

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Espanhol

Compreende Bem, Fala Razoavelmente, Lê Bem, Escreve Razoavelmente.

Bandeira representando o idioma Francês

Compreende Razoavelmente, Fala Razoavelmente, Lê Razoavelmente, Escreve Razoavelmente.

Áreas de atuação

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Inteligencia Artificial/Especialidade: Processamento da Linguagem Natural.

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Inteligencia Artificial/Especialidade: Recuperação de Informações.

Participação em eventos

NAACL 2010. 2010. (Congresso).

PROPOR 2010. Challenging choices for text simplification. 2010. (Congresso).

Microsoft External Research Symposium.PorSimples: Simplification of Portuguese Texts: Fostering Digital Inclusion and Accessibility. 2010. (Simpósio).

NAACL 2009. 2009. (Congresso).

CSBC 2009. 2009. (Congresso).

STIL 2009.Fast and Practical Corpus Processing using Standard Linux Tools. 2009. (Simpósio).

EBRALC 2009.Processamento rápido e prático de corpora usando ferramentas padrão do Linux. 2009. (Outra).

COLING 2008. Statistical anaphora resolution in biomedical texts. 2008. (Congresso).

DAARC 2007. Annotation of anaphoric relations in biomedical full-text articles using a domain-relevant scheme. 2007. (Congresso).

LREC 2004. Can anaphoric definite descriptions be replaced by pronouns?. 2004. (Congresso).

LREC 2002. Evaluation of parsed corpora: Experiments in user-transparent and user-visible evaluation. 2002. (Congresso).

DAARC 2002. 2002. (Congresso).

CSBC 2001. 2001. (Congresso).

ESSLLI - European Summer School in Logic, Language and Information.ESSLLI - European Summer School in Logic, Language and Information. 2001. (Outra).

Participação em bancas

Aluno: Matheus Ricardo Uihara Zingarelli

Monard, Maria Carolina;Gasperin, Caroline. Atendimento de Requisições em Time de Suporte Nível 3. 2009. Trabalho de Conclusão de Curso (Graduação em Bacharelado em Ciência da Computação) - Universidade de São Paulo.

Produções bibliográficas

  • Karamanis, Nikiforos ; Seal, Ruth ; Lewin, Ian ; McQuilton, Peter ; Vlachos, Andreas ; GASPERIN, C. V. ; Drysdale, Rachel ; Briscoe, Ted . Natural Language Processing in aid of FlyBase curators. BMC Bioinformatics , v. 9, p. 193, 2008.

  • GASPERIN, C. V. ; LIMA, V. L. S. . Experiments on Extracting Semantic Relations from Syntactic Relations. In: Alexander Gelbukh. (Org.). Computational Linguistics and Intelligent Text Processing, Lecture Notes in Computer Science. : Springer-Verlag, 2003, v. , p. -.

  • GASPERIN, C. V. ; LIMA, V. L. S. . Evaluating automatically computed word similarity. In: Jorge Baptista; Isabel Trancoso; Maria das Graças Volpe Nunes. (Org.). Proceedings of PROPOR'2003. Lecture Notes in Computer Science.. : Springer-Verlag, 2003, v. , p. -.

  • Gasperin, Caroline ; Maziero, Erick ; Aluísio, Sandra M. . Challenging Choices for Text Simplification. In: PROPOR 2010, 2010, Porto Alegre. Computational Processing of the Portuguese Language. Lecture Notes in Artificial Intelligence.. Berlin / Heidelberg: Springer, 2010. v. 6001. p. 40-50.

  • Aluísio, Sandra M. ; Lúcia Specia ; Gasperin, Caroline ; Scarton, Carolina . Readability assessment for text simplification. In: NAACL-HLT 2010 Workshop on Innovative Use of NLP for Building Educational Applications, 2010, Los Angeles. Proceedings of the NAACL-HLT 2010 Workshop on Innovative Use of NLP for Building Educational Applications, 2010. p. 1-9.

  • Pardo, Thiago ; Gasperin, Caroline ; Caseli, Helena ; Nunes, Graça . Computational Linguistics in Brazil: An Overview. In: NAACL-HLT 2010 Workshop on Young Investigators in the Americas, 2010, Los Angeles. Proceedings of the NAACL HLT 2010 Young Investigators Workshop on Computational Approaches to Languages of the Americas, 2010. p. 1-7.

  • Aluísio, Sandra M. ; Gasperin, Caroline . Fostering Digital Inclusion and Accessibility: The PorSimples project for Simplification of Portuguese Texts. In: NAACL-HLT 2010 Workshop on Young Investigators in the Americas, 2010, Los Angeles. Proceedings of the NAACL HLT 2010 Young Investigators Workshop on Computational Approaches to Languages of the Americas, 2010. p. 46-53.

  • Scarton, Carolina ; Oliveira, Matheus ; Cândido Júnior, Arnaldo ; Gasperin, Caroline ; Aluísio, Sandra M. . SIMPLIFICA: a tool for authoring simplified texts in Brazilian Portuguese guided by readability assessments. In: NAACL-HLT 2010 Demonstration Session, 2010, Los Angeles. Proceedings of the NAACL-HLT 2010 Demonstration Session, 2010. p. 41-44.

  • Gasperin, Caroline ; Lúcia Specia ; Pereira, Tiago ; Aluísio, Sandra M. . Learning When to Simplify Sentences for Natural Text Simplification. In: VII Encontro Nacional de Inteligência Artificial, 2009, Bento Gonçalves. Anais do VII Encontro Nacional de Inteligência Artificial, 2009. p. 809-818.

  • Gasperin, Caroline ; Maziero, Erick ; Lúcia Specia ; Pardo, Thiago ; Aluísio, Sandra M. . Natural language processing for social inclusion: a text simplification architecture for different literacy levels. In: XXXVI Seminário Integrado de Software e Hardware, 2009, Bento Gonçalves. XXX Congresso da Sociedade Brasileira de Computação, 2009. p. 387-401.

  • Gasperin, Caroline . Active Learning for Anaphora Resolution. In: NAACL-HLT 2009 Workshop on Active Learning for Natural Language Processing, 2009, Boulder, CO. Proceedings of NAACL-HLT 2009 Workshop on Active Learning for Natural Language Processing, 2009.

  • Cândido Júnior, Arnaldo ; Maziero, Erick ; Gasperin, Caroline ; Pardo, Thiago ; Lúcia Specia ; Aluísio, Sandra M. . Supporting the Adaptation of Texts for Poor Literacy Readers: a Text Simplification Editor for Brazilian Portuguese. In: NAACL-HLT 2009 Workshop on Innovative Use of NLP for Building Educational Applications, 2009, Boulder, CO. Proceedings of the NAACL-HLT 2009 Workshop on Innovative Use of NLP for Building Educational Applications, 2009.

  • Gasperin, Caroline ; Briscoe, Ted . Statistical anaphora resolution in biomedical texts. In: Coling 2008, 2008, Manchester, Inglaterra. Proceedings of COLING 2008, 2008.

  • Gasperin, Caroline ; Karamanis, Nikiforos ; Seal, Ruth . Annotation of anaphoric relations in biomedical full-text articles using a domain-relevant scheme. In: 6th Discourse Anaphora and Anaphor Resolution Colloquium, 2007, Lagos, Portugal. Proceedings of DAARC 2007, 2007.

  • Andreas Vlachos ; GASPERIN, C. V. ; Ian Lewin ; Ted Briscoe . Bootstrapping the recognition and anaphoric linking of named entities in Drosophila articles. In: Pacific Symposium in Biocomputing 2006, 2006, Hawai. Proceedings of PSB 2006, 2006.

  • Andreas Vlachos ; Gasperin, Caroline . Bootstrapping and Evaluating Named Entity Recognition in the Biomedical Domain. In: BioNLP 2006, 2006, New York. Proceedings of BioNLP 2006, 2006.

  • Judita Preiss ; GASPERIN, C. V. ; Ted Briscoe . Can anaphoric definite descriptions be replaced by pronouns?. In: LREC 2004, 2004, Lisboa. Proceedings of LREC, 2004.

  • GASPERIN, C. V. ; VIEIRA, R. . Using word similarity lists for resolving indirect anaphora. In: Workshop on Reference Resolution - ACL 2004, 2004, Barcelona. Proceedings of ACL 2004, 2004.

  • GASPERIN, C. V. ; SALMON-ALT, S. ; VIEIRA, R. . How useful are similarity word lists for indirect anaphora resolution?. In: DAARC 2004, 2004, Sao Miguel, Açores. Proceedings of DAARC 2004, 2004.

  • GASPERIN, C. V. ; VIEIRA, R. ; GOULART, R. ; QUARESMA, P. . Extracting XML syntactic chunks from Portuguese corpora. In: TALN 2003, Workshop on NATURAL LANGUAGE PROCESSING OF MINORITY LANGUAGES, 2003, Batz-sur-Mer. Proceedings of TALN 2003, 2003. v. 2.

  • VIEIRA, R. ; GASPERIN, C. V. ; GOULART, R. ; SALMON-ALT, S. . From concrete to virtual annotation mark-up language: the case of COMMOn-REFs. In: ACL 2003 - Workshop on Linguistic Annotation: Getting the Model Right, 2003, Sapporo. Proceedings of ACL 2003, 2003.

  • VIEIRA, R. ; GASPERIN, C. V. ; GOULART, R. . From manual to automatic annotation of coreference. In: International Symposium on Reference Resolution and Its Applications to Question Answering and Summarization, 2003, Veneza. Proceedings ..., 2003.

  • GASPERIN, C. V. ; GOULART, R. ; VIEIRA, R. . Uma ferramenta para resolução automática de correferência. In: ENIA 2003, 2003, Campinas. Anais do CSBC 2003, 2003.

  • SANTOS, D. ; GASPERIN, C. V. . Evaluation of parsed corpora: Experiments in user-transparent and user-visible evaluation. In: LREC 2002, 2002, Las Palmas de Gran canaria. Proceedings of LREC 2002, 2002.

  • VIEIRA, R. ; SALMON-ALT, S. ; GASPERIN, C. V. ; SCHANG, E. ; OTHERO, G. . Coreference and anaphoric relations of demonstrative noun phrases in multilingual corpus. In: Discourse Anaphora and Anaphor Resolution Colloquium, 2002, Lisboa. DAARC'2002. Lisboa: Edições Colibri, 2002.

  • GASPERIN, C. V. ; LIMA, V. L. S. . Semantic similarity from syntactic relations. In: IBERAMIA - Workshop MLIA&NLP, 2002, Sevilla. Multilingual Information Access & Natural Language Processing, 2002.

  • GASPERIN, C. V. ; LIMA, V. L. S. . Aplicação de uma técnica baseada em sintaxe para extração de relações semânticas entre palavras a partir de corpora. In: Encontro Nacional de Inteligência Artificial - ENIA, 2001, Fortaleza. Anais do XXI Congresso da Sociedade Brasileira de Computação, 2001.

  • GASPERIN, C. V. ; GAMALLO, P. ; AGUSTINI, A. ; LOPES, J. G. P. ; LIMA, V. L. S. . Using Syntactic Contexts for Measuring Word Similarity. In: Workshop on Semantic Knowledge Acquisition & Categorisation (13th Summer School in Logic, Language and Information - ESSLLI 2001), 2001, Helsinque. The Acquisition and Representation of Word Meaning, 2001.

  • GAMALLO, P. ; GASPERIN, C. V. ; AGUSTINI, A. ; LOPES, J. G. P. . Syntactic-Based Methods for Measuring Word Similarity. In: International Conference on Text, Speech and Dialogue - TSD 2001, 2001, Zelezna Ruda, 2001.

  • SIQUEIRA, M. ; SCHARKANSKI, J. ; GASPERIN, C. V. ; NAVAUX, P. O. A. . Segmentacão de Seqüências de Imagens Ecocardiográficas Utilizando Redes Neurais. In: ICIE2000 - VI Congresso Internacional de Ingenieria Informatica, 2000, Buenos Aires. Anais do ICIE2000, 2000.

  • SIQUEIRA, M. ; GASPERIN, C. V. ; SCHARKANSKI, J. ; ZIELINSKY, P. ; NAVAUX, P. O. A. . Echocardiographic Image Sequence Segmentation Using Self-Organizing Maps. In: IEEE Workshop on Neural Networks for Signal Processing - NNSP2000, 2000, Sydney. Proceedings of NNSP2000, 2000. p. 594-603.

  • PICCOLI, L. ; GASPERIN, C. V. ; NAVAUX, P. O. A. . Segmentação de Imagens Ecocardiográficas Utilizando Mapas de Kohonen. In: Congresso Argentino de Ciencias de La Computación, 1998, Neuquen. Trabajos Seleccionados, 1998. v. 1. p. 57-66.

  • Gasperin, Caroline . Semi-supervised anaphora resolution in biomedical texts. In: BioNLP 2006, 2006, New York. Proceedings of BioNLP 2006, 2006.

  • GASPERIN, C. V. ; NAVAUX, P. O. A. . Extração de Características de Textura de Imagens Ecocardiográficas. In: XI Salão de Iniciação Científica, 1999, Porto alegre. CD de resumos, 1999. p. 20-20.

  • GASPERIN, C. V. ; PICCOLI, L. ; NAVAUX, P. O. A. . Método de Segmentação de Imagens Ecocardiográficas Utilizando Redes Neurais. In: X Salão de Iniciação Científica, 1998, Porto Alegre. Livro de Resumos, 1998. p. 34-34.

  • GASPERIN, C. V. . Fundamentos do Processamento Estatístico da Linguagem Natural. Porto Alegre: PPGCC-PUCRS, 2001 (Relatório Técnico).

  • GASPERIN, C. V. ; LIMA, V. L. S. . Extração automática de relações semânticas a partir de corpora através de contextos sintáticos. Porto Alegre: PPGCC-PUCRS, 2001 (Seminário de Andamento).

  • GASPERIN, C. V. . Extração Automática de Relações Semânticas a partir de Relações Sintáticas. Porto Alegre: PPGCC-PUCRS, 2001 (Dissertação de mestrado).

  • GASPERIN, C. V. . Geração Automática de Thesaurus. Porto Alegre: PPGCC-PUCRS, 2000 (Plano de Estudo e Pesquisa).

  • GASPERIN, C. V. . Um estudo sobre a extração automática de relações semânticas a partir de corpora. Porto Alegre: PPGCC-PUCRS, 2000 (Trabalho Individual).

  • GASPERIN, C. V. ; WILDT, D. F. . Um Ambiente para Especificação de Transações Cooperantes. Porto Alegre: FACIN-PUCRS, 1999 (Trabalho de Conclusao).

Outras produções

Gasperin, Caroline . Processamento rápido e prático de corpora usando ferramentas padrão do Linux. 2010. (Curso de curta duração ministrado/Outra).

Gasperin, Caroline ; GOULART, R. ; VIEIRA, R. ; LIMA, V. L. S. . Processamento da Linguagem Natural Aplicado a Bioinformática. 2009. (Curso de curta duração ministrado/Outra).

Gasperin, Caroline . Fast and Practical Corpus Processing using Standard Linux Tools. 2009. (Curso de curta duração ministrado/Outra).

Gasperin, Caroline . Resolução de anáforas em textos biomédicos. 2009 (Apresentação oral) .

Gasperin, Caroline . Resolução de anáforas em textos biomédicos. 2009 (Apresentação oral) .

Gasperin, Caroline . Resolução de correferência e anáfora. 2009 (Apresentação oral) .

Gasperin, Caroline . Statistical Anaphora Resolution in Biomedical Texts. 2008 (Apresentação oral) .

Gasperin, Caroline . Statistical Anaphora Resolution in Biomedical Texts. 2008 (Apresentação oral) .

GASPERIN, C. V. . Semantic Similarity from Syntactic Relations. 2003 (Apresentação oral) .

GASPERIN, C. V. . Experiments on Extracting Semantics from Syntactic Relations. 2002 (Apresentação oral) .

Histórico profissional

Endereço profissional

  • Universidade de São Paulo, Instituto de Ciências Matemáticas e de Computação. , Av. Trabalhador São-Carlense, 400, Centro, 13560-970 - Sao Carlos, SP - Brasil, URL da Homepage:

Experiência profissional

2008 - 2008

Google Inc., Google

Vínculo: Estágio, Enquadramento Funcional: Estagiário, Carga horária: 40

Outras informações:
Google Cracóvia, Polônia.

2003 - 2003

Laboratoire lorrain de recherche en informatique

Vínculo: Pesquisador visitante, Enquadramento Funcional: Bolsista, Carga horária: 40, Regime: Dedicação exclusiva.

Outras informações:
Projeto COMMOn-REFs

Atividades

  • 05/2003 - 07/2003

    Pesquisa e desenvolvimento , Grupo Langue et Dialogue, .,Linhas de pesquisa

2002 - 2003

Universidade do Vale do Rio dos Sinos

Vínculo: Bolsista DTI, Enquadramento Funcional: Pesquisador, Carga horária: 40, Regime: Dedicação exclusiva.

Outras informações:
Projeto COMMOn-REFs - A computational model for processing referring expressions

Atividades

  • 01/2002 - 09/2002

    Pesquisa e desenvolvimento , Centro de Ciências Exatas e Tecnológicas, Programa Interdisciplinar de Pós Graduação Em Computação Aplicada.,Linhas de pesquisa

2001 - 2001

Universidade Nova de Lisboa

Vínculo: Missão de trabalho, Enquadramento Funcional: Pesquisador visitante, Carga horária: 40, Regime: Dedicação exclusiva.

Outras informações:
Projeto FUNDAÇÕES (CAPES)

Atividades

  • 01/2001 - 02/2001

    Pesquisa e desenvolvimento , Faculdade de Ciências e Tecnologia, Departamento de Informática.,Linhas de pesquisa

  • 01/2001 - 02/2001

    Outras atividades técnico-científicas , Faculdade de Ciências e Tecnologia, .,Atividade realizada, Missão de trabalho relativa ao projeto FUNDAÇÕES (CAPES).

1997 - 2000

Universidade Federal do Rio Grande do Sul

Vínculo: Bolsista Iniciação Científica, Enquadramento Funcional: Auxiliar de pesquisa, Carga horária: 20

Atividades

  • 11/1997 - 02/2000

    Pesquisa e desenvolvimento , Instituto de Informática, Programa de Pós Graduação Em Computação.,Linhas de pesquisa