Vanessa Marquiafável Serrani

Concluiu o doutorado em Estudos Linguísticos pela Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP/IBILCE) em 2015. Pela Universidade Federal de São Carlos (UFSCar) obteve o título de mestre em Linguística (2007) e sua Licenciatura Plena em Letras - Portugues/Inglês (2004). Tem experiência na área de Linguística, atuando principalmente nos seguintes temas: Linguística de Corpus, Linguistica Computacional, Transcrição Fonética do Português do Brasil, Transcrição Fonética Automática, Escrita de Gênero Cientifico e Ferramentas Computacionais de Suporte à Escrita Cientifica.

Informações coletadas do Lattes em 19/05/2026

Acadêmico

Formação acadêmica

Doutorado em Estudos Lingüísticos

2011 - 2015

Universidade Estadual Paulista Júlio de Mesquita Filho
Título: Ambiente Web de suporte à Transcrição Fonética Automática de Verbetes em Dicionários do Português do Brasil
Claudia Zavaglia. Coorientador: Luiz Carlos Cagliari. Bolsista do(a): Fundação de Amparo à Pesquisa do Estado de São Paulo, FAPESP, Brasil. Palavras-chave: Transcricao Fonetica Automatica; Linguistica - processamento de dados; lexicografia.Grande área: Lingüística, Letras e ArtesGrande Área: Lingüística, Letras e Artes / Área: Lingüística / Subárea: COMPUTACIONAL. Setores de atividade: Pesquisa e desenvolvimento científico.

Mestrado em Linguística

2005 - 2007

Universidade Federal de São Carlos
Título: Um processo para a geração de recursos linguisticos aplicáceis em ferramentas de auxílio à escrita científica,Ano de Obtenção: 2007
Sandra Maria Aluísio.Bolsista do(a): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, CAPES, Brasil. Palavras-chave: Ferramentas de Suporte à Escrita; Linguística de Corpus; Linguistica - processamento de dados; Lingua inglesa - ensino; Genero textual.Grande área: Lingüística, Letras e ArtesSetores de atividade: Educação.

Graduação em Licenciatura Em Letras Com Ênfase Em Inglês

2000 - 2004

Universidade Federal de São Carlos
Título: Compilação e Anotação de Corpus do Português do Brasil - (Projeto Lacio-Web)
Orientador: Profa. Dra. Sandra Maria Aluísio
Bolsista do(a): Conselho Nacional de Desenvolvimento Científico e Tecnológico, CNPq, Brasil.

Formação complementar

2012 - 2012

Aprendizado de Máquina para tarefas de PLN. , Universidade de São Paulo, USP, Brasil.

2012 - 2012

Os exemplos como elementos reveladores. (Carga horária: 2h). , Universidade Estadual Paulista Júlio de Mesquita Filho, UNESP, Brasil.

2012 - 2012

Conhecimento em Lexicologia para trabalho lexicogr. (Carga horária: 2h). , Universidade Estadual Paulista Júlio de Mesquita Filho, UNESP, Brasil.

2012 - 2012

as intersecções entre Terminologia e Lexicologia. (Carga horária: 2h). , Universidade Estadual Paulista Júlio de Mesquita Filho, UNESP, Brasil.

2006 - 2006

Enhancing the Writing of Scientific Papers. (Carga horária: 25h). , Universidade de São Paulo, USP, Brasil.

2005 - 2005

WordSmith Tools-ferramenta de análise linguística. , Universidade Federal de São Carlos-Departamento de Letras, UFSCAR, Brasil.

2004 - 2004

Recursos Linguísticos para processamento de Língua. (Carga horária: 16h). , Universidade de São Paulo, USP, Brasil.

1997 - 1999

Curso Integrado de Ambiente Windows. (Carga horária: 120h). , Microcamp Internacional, MC, Brasil.

1989 - 1997

Lingua Inglesa. (Carga horária: 1180h). , Centro de Cultura Anglo Americana, CCAA, Brasil.

Idiomas

Inglês

Compreende Bem, Fala Razoavelmente, Lê Bem, Escreve Bem.

Espanhol

Compreende Bem, Fala Razoavelmente, Lê Bem, Escreve Pouco.

Português

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Participação em eventos

International Conference on Computational Processing of Portuguese-PROPOR. Rule-based Algorithms for Automatic Pronunciation of Portuguese Verbal Inflections. 2014. (Congresso).

International Conference on Computational Processing of Portuguese-PROPOR. PETRUS: A rule-based grapheme-to-phone converter for Brazilian Portuguese. 2014. (Congresso).

V SELIN ? Seminário de Estudos Linguísticos da UNESP.Proposta de Suporte Computacional à Inserção de Transcrição Fonética em Lemas de Verbetes de Dicionários do Português do Brasil. 2013. (Seminário).

IV Seminário de Estudos Linguísticos da UNESP.Proposta de transcritor fonético automático para uso lexicográfico. 2012. (Seminário).

VI Escola Brasileira de Linguística Computacional. 2012. (Outra).

XI ELC ? Encontro de Linguística de Corpus.Proposta de Suporte Computacional à inserção de Transcrição Fonética em lemas de verbetes de dicionários do português do Brasil. 2012. (Outra).

59 Seminário do Grupo de Estudos Linguísticos do Estado de São Paulo.Uma proposta automática para a tarefa manual de transcrição fonética em verbetes de dicionários do Português do Brasil. 2011. (Seminário).

The 8th Brazilian Symposium in Information and Human Language Technology.Transcrição fonética automática para lemas em verbetes de dicionários do Português do Brasil. 2011. (Simpósio).

V Encontro do Dicionario Historico - Portugues do Brasil (sec. XVI, XVII, XVIII). 2007. (Outra).

7 Workshop on Computational Processing of Written and Spoken Portugues - PROPOR. 2006. (Oficina).

Ciclio de Palestras do NILC (Nucleo Interinstitucional de Linguistica Computacional).Ciclo de Palestras do Nucleo Interinstitucional de Linguistica Computacional. 2006. (Outra).

Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana - STIL.Um processo semi-automático para a geração de ferramentas de suporte à escrita científica em inglês. 2006. (Simpósio).

The Intenational JOINT Conference IBERAMIA/SBIA/SBRN 2006. 2006. (Outra).

III Congresso de Pos-Graduacao da UFSCar. Uma metodologia para a automatizacao da construcao de ferramentas de suporte a escrita do ambiente AMADEUS em novos dominios. 2005. (Congresso).

V Encontro de Corpora. 2005. (Encontro).

IV Encontro de Corpora. 2004. (Encontro).

III Encontro de Corpora. 2003. (Encontro).

50 Seminario do Grupo de Estudos Linguisticos do Estado de Sao Paulo - Gel. 2002. (Congresso).

II Construir Pontes: Universidade e Escola no Ensino de Ingles. 2001. (Oficina).

Focus on Motivation. 2000. (Outra).

I Construir Pontes: Universidade e Escola no Ensino de Inlges. 2000. (Outra).

IV Jornada de Letras. 2000. (Outra).

Produções bibliográficas

Marquiafavel, Vanessa ; Uebel, L.F. . Bancos de Fala para o Português Brasileiro. Linguamática (Braga) , v. 3, p. 69-75, 2011.
Estivalet, Gustavo ; HARTMANN, N. ; Marquiafavel, Vanessa ; LUKASOVA, K. ; CARTHERY-GOULART, M. T. ; ALUISIO, S. . LexPorBr infantil: uma base lexical tripartida e com interface web de textos ouvidos, produzidos, e lidos por crianças. In: STIL - Symposium in Information and Human Language Technology, 2019, Salvador, BA. Proceedings of STIL - Symposium in Information and Human Language Technology, 2019.
MARQUIAFAVEL, V ; BOKAN, A. ; Zavaglia, C. . A rule-based grapheme-to-phone converter for Brazilian Portuguese. In: International Conference on Computational Processing of Portuguese-PROPOR, 2014, São Carlos-SP. LNAI 8775, 2014.
MARQUIAFAVEL, V ; Shulby, C. ; VEIGA, A. ; PROENCA, J. ; CANDEIAS, S. ; PERDIGAO, F. . Rule-based Algorithms for Automatic Pronunciation of Portuguese Verbal Inflections. In: International Conference on Computational Processing of Portuguese-PROPOR, 2014, São Carlos. LNAI 8775. Heidelberg: Springer, 2014. p. 36-47.
Shulby, C. ; MENDONCA, G. ; MARQUIAFAVEL, V . Automatic Disambiguation of Homographic Heterophone Pairs Containing Open and Closed Mid Vowels. In: IX Brazilian Symposium in Information and Human Language Technology ? STIL, 2013, Fortaleza, Ceará. Anais do IX Brazilian Symposium in Information and Human Language Technology ? STIL 2013, 2013.
Marquiafavel, Vanessa ; GENOVES JUNIOR, L. C. ; Aluisio, S. M. . Um processo semi-automático para a geração de ferramentas de suporte à escrita científica em inglês. In: Fourth Workshop in Information and Human Language Technology (TIL'2006), 2006, Ribeirão Preto. Proceedings of the International Joint Conference IBERAMIA/SBIA/SBRN 2006, 2006. v. 1.
Aluisio, S. M. ; Pelizzoni, J. M. ; Marchi, R. A. ; Oliveira, L. H. ; Manenti, R. P. ; Marquiafável, V. S. . An account of the challenge of tagging a reference corpus of Brazilian Portuguese. In: Computacional Processing of the Portuguese Language, 2003, Faro. Proceedings of the 6th International Workshop of Computacional Processing of the Portuguese Language, 2003. v. 1.
Marquiafavel, Vanessa ; Zavaglia, Claudia . Transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil. In: 8th Brazilian Symposium in Information and Human Language Technology, 2011, Cuiabá-MS. 8th Brazilian Symposium in Information and Human Language Technology, 2011.
Marquiafável, V. S. ; Aluisio, S. M. . Uma Metodologia para a geração de recursos linguísticos de ferramentas de suporte à escrita do ambiente AMADEUS em novos domínios. In: Congresso de Pós-Graduação da UFSCar, 2005, São Carlos - SP. Jornada Científica da UFSCar, 2005.
Costa, L. ; MARQUIAFAVEL, V ; Zavaglia, C. . Lexicografia e a Interface com novas tecnologias: a utilização de ferramentas computacionais para a 'montagem'de dicionários de língua. In: 61o Grupo de Estudos Linguísticos do Estado de São Paulo - GEL, 2013, São Paulo-SP. Cadernos de resumos do 61o Gel (Grupo de Estudos Linguísticos do Estado de São Paulo), 2013.
MARQUIAFAVEL, V ; Zavaglia, C. . Proposta de suporte computacional à inserção de transcrição fonética em lemas de verbetes de dicionários do português do Brasil. In: XI ELC ? Encontro de Linguística de Corpus, 2012, São Carlos-SP. Anais do XI ELC, 2012.
MARQUIAFÁVEL, V. S. ; Zavaglia, Claudia . Proposta de Suporte Computacional à Inserção de Transcrição Fonética em lemas de Verbetes de Dicionários do Português do Brasil. In: V Congresso Internacional de Lexicografía Hispánica, 2012, Madrid. V Congresso Internacional de Lexicografía Hispánica, 2012.
Marquiafavel, Vanessa ; Zavaglia, Claudia . Uma proposta automática para a tarefa manual de transcrição fonética em verbetes de dicionários do Português do Brasil. In: 59 Grupo de Estudos Linguísticos do Estado de São Paulo - Gel, 2011, Bauru-SP. 59 Seminário do Grupo de Estudos Linguísticos do estado de São Paulo- Gel, 2011.
Marquiafavel, Vanessa ; Shulby, C. ; VEIGA, A. ; PROENCA, J. ; CANDEIAS, S. ; PERDIGAO, F. . Rule-based Algorithms for Automatic Pronunciation of Portuguese Verbal Inflections. 2014. (Apresentação de Trabalho/Conferência ou palestra).
Marquiafavel, Vanessa ; BOKAN, A. ; Zavaglia, Claudia . PETRUS: A rule-based grapheme-to-phone converter for Brazilian Portuguese. 2014. (Apresentação de Trabalho/Conferência ou palestra).
MARQUIAFAVEL, V . PROPOSTA DE SUPORTE COMPUTACIONAL À INSERÇÃO DE TRANSCRIÇÃO FONÉTICA EM LEMAS DE VERBETES DE DICIONÁRIOS DO PORTUGUÊS DO BRASIL. 2013. (Apresentação de Trabalho/Seminário).
MARQUIAFAVEL, V . Proposta de Suporte Computacional à inserção de Transcrição Fonética em Lemas de verbetes de dicionários do portguês do Brasil. 2012. (Apresentação de Trabalho/Comunicação).
MARQUIAFAVEL, V ; Zavaglia, Claudia . Proposta de suporte computacional à inserção de transcrição fonética em lemas de verbetes de dicionários do português do Brasil. 2012. (Apresentação de Trabalho/Comunicação).
MARQUIAFÁVEL, V. S. ; Zavaglia, C. . Transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil. 2011. (Apresentação de Trabalho/Comunicação).
Zavaglia, C. ; MARQUIAFÁVEL, V. S. . AUTOMATIC PHONETIC TRANSCRIPTION OF LEMMAS FROM BRAZILIAN DICTIONARIES ENTRIES. 2011. (Apresentação de Trabalho/Simpósio).
MARQUIAFÁVEL, V. S. . Desafios e percalcos na construcao de um banco de fala em portugues do Brasil. 2008. (Apresentação de Trabalho/Outra).
MARQUIAFÁVEL, V. S. ; GENOVES JUNIOR, L. C. . Metodologia e sistemas para construcao de ambientes de auxilio a escrita cientifica em Ingles. 2006. (Apresentação de Trabalho/Outra).
MARQUIAFÁVEL, V. S. . Um processo para a geração de recursos linguísticos aplicáveis em ferramentas de auxilio a escrita cientifica 2007 (Dissertacao de Mestrado).
Marquiafável, V. S. ; Kawachi, C. J. . Uma Proposta Diferente para a abordagem dos Neologismos no Ensino de Português 2003 (Trabalho de Conclusão de Curso).

Outras produções

MARQUIAFAVEL, V . Parecer sobre artigo submetido ao Journal of Computer Science (INFOCOMP) 2014. 2014.

MARQUIAFAVEL, V . Parecer sobre resumos e artigos submetidos ao XI ELC. 2012.

MARQUIAFAVEL, V . Relatório Final - bolsa Fapesp doutorado. 2014. (Relatório de pesquisa).

MARQUIAFAVEL, V . Relatório bolsa BEPE-FAPESP sobre Estágio de Pesquisa no exterior. 2014. (Relatório de pesquisa).

MARQUIAFAVEL, V . Segundo Relatório Parcial - bolsa Fapesp doutorado. 2013. (Relatório de pesquisa).

Serrani, V.S. ; Costa, L. ; Zavaglia, Claudia . Lexicografia e Computação: um casamento que deu certo!. 2012. (Curso de curta duração ministrado/Extensão).

MARQUIAFAVEL, V . Primeiro Relatório Parcial - bolsa Fapesp doutorado. 2012. (Relatório de pesquisa).

Serrani, V.S. . Parecer sobre trabalhos submetidos ao XI ELC. 2012. (Parecer para evento científico).

Marquiafavel, Vanessa . Relatório Individual Sintético - bolsista Fapesp. 2010. (Relatório de pesquisa).

Marquiafavel, Vanessa . Relatório Individual Sintético - bolsista Fapesp (B). 2009. (Relatório de pesquisa).

Marquiafavel, Vanessa . Relatório Individual Sintético - bolsista Fapesp (A). 2009. (Relatório de pesquisa).

Marquiafavel, Vanessa . Relatório Individual Sintético - bolsista Fapesp. 2008. (Relatório de pesquisa).

Vanessa Marquiafavel ; Aluisio, S. M. . Estrutura Esquemática: uma investigação da seção 'metodologia' em artigos científicos da área de Farmácia. 2005. (Relatório de pesquisa).

Projetos de pesquisa

2015 - Atual

Desenvolvimento de recursos computacionais para tecnologias de fala, Projeto certificado pela empresa SPEECHTERA DESENVOLVIMENTO DE PROGRAMAS PARA COMPUTADORES LTDA - ME em 28/04/2016., Descrição: Este projeto visa a criação de recursos computacionais para o desenvolvimento de Tecnologias de Fala, voltadas para o Português Brasileiro (Português Brasileiro). Com o desenvolvimento de algoritmos robustos para tratar bases de dados de fala, aplicações envolvendo reconhecimento ou síntese de fala, respectivamente, ASR (do inglês Automatic Speech Recognition) e TTS (do inglês Text-to-Speech), têm ganhado mais espaço em nosso cotidiano e se tornado cada vez mais precisas. No entanto, apesar de o Português Brasileiro ser a sexta língua mais falada no mundo, os recursos disponíveis para desenvolver tecnologias de fala para esse idioma ainda são escassos: há poucas bases de dados, conversores grafema-fonema e modelos acústicos ou de pronúncia. Este projeto busca, justamente, atuar nessa lacuna. Nosso propósito é desenvolver recursos computacionais de modo a incitar o desenvolvimento de tecnologias de fala para o Português Brasileiro, na indústria e na academia. Propõe-se a elaboração de quatro tipos de produtos: i) corpora de fala, ii) modelos acústicos, iii) modelos de pronúncia e iv) conversores grafema-fonema. Sobre os corpora de fala, propomos métodos de coleta e anotação de dados baseada em crawling e crowd-sourcing, que possibilitarão o desenvolvimento de recursos de fala a preços mais competitivos e acessíveis que os existentes atualmente no mercado. Técnicas do estado da arte serão empregadas na elaboração dos modelos acústicos, a exemplo de Deep Neural Networks; e dos conversores grafema-fonema, como modelos híbridos, baseados em regras manuais e aprendizado de máquina (SVM, CART, MARS). O modelo de negócio proposto centra-se em uma abordagem business-to-business (B2B), voltada para empresas de Tecnologia da Informação, Processamento de Fala e Processamento de Linguagem Natural, pensando, especialmente, no nicho de startups.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Mestrado acadêmico: (2) Doutorado: (2) . , Integrantes: Vanessa Marquiafável Serrani - Integrante / Vanessa Silva Marquiafável - Coordenador / Lucas Vinicius Avanço - Integrante., Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Outra.
2014 - 2014

Sistema de pronunciação de verbos: uma proposta para o Português do Brasil, Descrição: Esta pesquisa de natureza aplicada visa sistematizar a pronunciação dos verbos regulares do português brasileiro, utilizando para isso um método que engloba a análise da vogal temática dos verbos, a identificação do seu paradigma verbal que define os sufixos, bem como a alternância do timbre vocálico da última vogal do radical verbal. Este estudo será desenvolvido com base na bibliografia existente sobre o tema flexão verbal no Português do Brasil (gramáticas, manual de morfologia e breviário de verbos) e suportado com a avaliação de dados provenientes de um corpus de estudo, o CETENFolha. Pretende-se com esta pesquisa atingir resultados que viabilizem a criação de uma ferramenta de pronunciação em português brasileiro das flexões verbais dos verbos.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Doutorado: (1) . , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sara Candeias - Coordenador / Fernando Perdigão - Integrante., Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Bolsa., Número de produções C, T & A: 1
2011 - 2015

Ambiente web de suporte à transcrição fonética automática de verbetes em dicionários do Português do Brasil, Descrição: Este projeto dedica-se à construção de um ambiente Web dedicado à transcrição fonética automática de verbetes em dicionários do Português do Brasil. A motivação para construir esse ambiente partiu da grande correspondência existente entre os caracteres ortográficos do alfabeto do português brasileiro e seus respectivos sons, que acreditamos contribuir para a construção de uma ferramenta computacional que faça a conversão de símbolos ortográficos para sonoros de maneira automática e satisfatória. Dessa maneira, a hipótese que norteia este projeto é a de que a partir de um conjunto de aplicações computacionais poderá ser possível converter caracteres de unidades lexicais isoladas (verbetes) em suas unidades sonoras correspondentes, com a aplicação de um conjunto fixo e objetivo de critérios de anotação, sem que haja para isso qualquer tipo de intervenção humana. A conversão entre a unidade ortográfica (verbete de entrada do sistema) e a unidade lexical transcrita foneticamente (saída do sistema) terá como base as fontes padronizadas do International Phonetic Alphabet (IPA). Quanto ao modelo de dicção que será transcrito a partir dos verbetes, este seguirá a tendencia atual de refletir um modelo de dicção o mais universal possível, geral e neutra, sem variedades linguísticas e de uso corrente. Metodologicamente, o desenvolvimento do ambiente associará a Linguística de Corpus, a Fonética e a Fonologia para a construção de um dicionario fonético de grande vocabulário, do qual serão extraídas transcrições fonéticas para o treino da ferramenta computacional. Unirá as metodologias de trabalho da Computação para a confecção do sistema proposto com os instrumentos de validação do conhecimento da Estatística (Kappa) para mensurar a qualidade do corpus transcrito.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Doutorado: (1) . , Integrantes: Vanessa Marquiafável Serrani - Integrante / Vanessa Silva Marquiafável - Integrante / Zavaglia, Claudia - Coordenador., Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Bolsa., Número de produções C, T & A: 10
2005 - 2007

Um processo para a geração de recursos linguisticos aplicáceis em ferramentas de auxílio à escrita científica, Projeto certificado pelo(a) coordenador(a) Sandra Maria Aluísio em 18/04/2019., Descrição: No ambiente acadêmico atual, a língua inglesa foi escolhida como a lingua franca da ciência nas mais variadas áreas do conhecimento. No entanto, sabe-se que a tarefa de produção de um texto científico adequado, no caso o artigo científico, não é fácil, principalmente se o escritor é iniciante nessa atividade e sua língua materna não é o inglês. Uma alternativa para esse problema é a utilização de ferramentas computacionais que apóiam as diferentes etapas do processo de escrita de um texto científico, cuja base seja formada por material lingüístico autêntico coletado de artigos científicos publicados e indexados de forma a facilitar seu rápido acesso. Dentre essas ferramentas, destacamos três em especial: o AMADEUS (Amiable Article Development for User Support), que apóia a escrita de artigos científicos em inglês nas áreas de Física e Computação, o SciPo, inspirado no AMADEUS, mas que apóia a escrita de teses e dissertações em português na área de Ciências da Computação e o SciPo-Farmácia, que dá suporte à escrita de artigos científicos em inglês na área de Ciências Farmacêuticas. O objetivo principal deste projeto de pesquisa foi formalizar um processo para a construção de recursos lingüísticos em inglês a serem usados em ferramentas de suporte à escrita científica semelhantes ao SciPo-Farmácia. A principal metodologia utilizada derivou da Lingüística de Corpus (usamos tanto a abordagem dirigida por córpus quanto baseada em córpus), pois a eficácia das ferramentas citadas, conforme experiências relatadas por seus desenvolvedores, está fortemente ligada ao fato de possuírem um córpus com textos da área de pesquisa do pesquisador-escritor, a partir do qual reutilizam- se trechos bem-escritos na escrita de um novo artigo. A avaliação do processo aqui proposto se deu em dois momentos: i) na avaliação da clareza e da completude dos manuais de construção de recursos lingüísticos, e ii) na avaliação da qualidade dos recursos lingüísticos produzidos e elaboração de uma estimativa do tempo gasto na construção dos recursos lingüísticos descritos por esses módulos. A estatística Kappa foi escolhida para medir a qualidade do material produzido nas duas etapas, a qual indicou valores entre k=0.72 e k=1,0. Esses bons resultados podem ser atribuídos ao entendimento do conteúdo dos manuais utilizados na avaliação das tarefas contidas no processo proposto. Dentre as contribuições desta pesquisa podemos citar: a possibilidade de construção de recursos lingüísticos para gerar uma ferramenta de suporte à escrita científica em inglês para várias áreas que possuem a pesquisa experimental como foco, utilizando apenas as informações contidas no processo proposto; o auxilio na divulgação, via Web, de ferramentas computacionais de suporte à escrita enquanto recurso didático a ser utilizado no ensino-aprendizado de inglês científico; a divulgação de métricas para avaliação de modelos de estruturas esquemáticas propostas; e disponibilização de córpus anotados em nível retórico para serem usados em ferramentas de processamento de língua natural ou ensino.. , Situação: Concluído; Natureza: Pesquisa. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Vanessa Silva Marquiafável - Integrante / Sandra Maria Aluisio - Coordenador.

Projetos de desenvolvimento

2011 - Atual

Transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil, Descrição: Este projeto visa construir um ambiente computacional para suporte à transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil. Nossa hipótese norteadora é a de que a partir de um conjunto de aplicações computacionais poderá ser possível converter caracteres de unidades lexicais isoladas (verbetes) em suas unidades fonéticas correspondentes, com a aplicação de um conjunto fixo e objetivo de critérios de anotação, sem que haja para isso qualquer tipo de intervenção humana.. , Situação: Em andamento; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Coordenador.
2003 - 2007

Scipo-Farmacia, Descrição: O sistema SciPo-Farmácia foi um projeto realizado no NILC, sob a orientação da Profa. Sandra Maria Aluísio (sandra@icmc.usp.br) e do Prof. Osvaldo Novais de Oliveira Jr. (chu@if.sc.usp.br), em parceria com a Faculdade de Ciências Farmacêuticas da USP-São Paulo, particularmente com os professores Adalberto Pessoa Jr. (pessoajr@usp.br) e Ana Campa (anacampa@usp.br). A análise textual dos artigos da ferramenta foi realizada pela lingüísta Aline Maria Pacífico Manfrim e posteriormente avaliada pelo Prof. Osvaldo Novais de Oliveira Jr. e Profa. Sandra Maria Aluísio. Adaptado do projeto SciPo, trabalho de doutorado de Valéria D. Feltrim, intitulado "Suporte Computacional à Escrita Científica em Português", desenvolvido no NILC (ICMC - USP/São Carlos), sob a orientação da Profa. Dra. Maria das Graças Volpe Nunes (orientadora) e da Profa. Dra. Sandra Maria Aluísio (co-orientadora), volta-se para a escrita de todos os componentes de um artigo científico (resumos, introduções, metodologias, resultados, discussões e conclusões) tendo como língua alvo o inglês.. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sandra Maria Aluisio - Coordenador.
2002 - 2004

Projeto Lácio-Web, Descrição: Para atender o objetivo de aumentar o volume de conteúdo em português na Web, são necessárias ferramentas automáticas de criação e manipulação desse conteúdo. Nesse cenário, o problema em torno do qual se organiza esta proposta é prover recursos computacionais e lingüísticos básicos que dão suporte à construção de ferramentas automáticas (de recuperação e extração inteligentes da informação, reconhecimento de fala, correção ortográfica e gramatical, por exemplo) para o português --- a exemplo do que ocorreu e ocorre com o inglês. Corpora são considerados o recurso mais básico para a pesquisa da língua através de métodos empíricos. O objetivo deste projeto é a construção e disponibilização de recursos de base, isto é, corpora representativos da língua e suas ferramentas associadas de apoio à anotação manual, navegação e busca, e dessa forma, começar um processo de equiparação do português ao tratamento automático de outras línguas.. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sandra Maria Aluisio - Coordenador.
2011 - Atual

Transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil, Descrição: Este projeto visa construir um ambiente computacional para suporte à transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil. Nossa hipótese norteadora é a de que a partir de um conjunto de aplicações computacionais poderá ser possível converter caracteres de unidades lexicais isoladas (verbetes) em suas unidades fonéticas correspondentes, com a aplicação de um conjunto fixo e objetivo de critérios de anotação, sem que haja para isso qualquer tipo de intervenção humana.. , Situação: Em andamento; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Coordenador.
2003 - 2007

Scipo-Farmacia, Descrição: O sistema SciPo-Farmácia foi um projeto realizado no NILC, sob a orientação da Profa. Sandra Maria Aluísio (sandra@icmc.usp.br) e do Prof. Osvaldo Novais de Oliveira Jr. (chu@if.sc.usp.br), em parceria com a Faculdade de Ciências Farmacêuticas da USP-São Paulo, particularmente com os professores Adalberto Pessoa Jr. (pessoajr@usp.br) e Ana Campa (anacampa@usp.br). A análise textual dos artigos da ferramenta foi realizada pela lingüísta Aline Maria Pacífico Manfrim e posteriormente avaliada pelo Prof. Osvaldo Novais de Oliveira Jr. e Profa. Sandra Maria Aluísio. Adaptado do projeto SciPo, trabalho de doutorado de Valéria D. Feltrim, intitulado "Suporte Computacional à Escrita Científica em Português", desenvolvido no NILC (ICMC - USP/São Carlos), sob a orientação da Profa. Dra. Maria das Graças Volpe Nunes (orientadora) e da Profa. Dra. Sandra Maria Aluísio (co-orientadora), volta-se para a escrita de todos os componentes de um artigo científico (resumos, introduções, metodologias, resultados, discussões e conclusões) tendo como língua alvo o inglês.. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sandra Maria Aluisio - Coordenador.
2002 - 2004

Projeto Lácio-Web, Descrição: Para atender o objetivo de aumentar o volume de conteúdo em português na Web, são necessárias ferramentas automáticas de criação e manipulação desse conteúdo. Nesse cenário, o problema em torno do qual se organiza esta proposta é prover recursos computacionais e lingüísticos básicos que dão suporte à construção de ferramentas automáticas (de recuperação e extração inteligentes da informação, reconhecimento de fala, correção ortográfica e gramatical, por exemplo) para o português --- a exemplo do que ocorreu e ocorre com o inglês. Corpora são considerados o recurso mais básico para a pesquisa da língua através de métodos empíricos. O objetivo deste projeto é a construção e disponibilização de recursos de base, isto é, corpora representativos da língua e suas ferramentas associadas de apoio à anotação manual, navegação e busca, e dessa forma, começar um processo de equiparação do português ao tratamento automático de outras línguas.. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sandra Maria Aluisio - Coordenador.
2011 - Atual

Transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil, Descrição: Este projeto visa construir um ambiente computacional para suporte à transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil. Nossa hipótese norteadora é a de que a partir de um conjunto de aplicações computacionais poderá ser possível converter caracteres de unidades lexicais isoladas (verbetes) em suas unidades fonéticas correspondentes, com a aplicação de um conjunto fixo e objetivo de critérios de anotação, sem que haja para isso qualquer tipo de intervenção humana.. , Situação: Em andamento; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Coordenador.
2003 - 2007

Scipo-Farmacia, Descrição: O sistema SciPo-Farmácia foi um projeto realizado no NILC, sob a orientação da Profa. Sandra Maria Aluísio (sandra@icmc.usp.br) e do Prof. Osvaldo Novais de Oliveira Jr. (chu@if.sc.usp.br), em parceria com a Faculdade de Ciências Farmacêuticas da USP-São Paulo, particularmente com os professores Adalberto Pessoa Jr. (pessoajr@usp.br) e Ana Campa (anacampa@usp.br). A análise textual dos artigos da ferramenta foi realizada pela lingüísta Aline Maria Pacífico Manfrim e posteriormente avaliada pelo Prof. Osvaldo Novais de Oliveira Jr. e Profa. Sandra Maria Aluísio. Adaptado do projeto SciPo, trabalho de doutorado de Valéria D. Feltrim, intitulado "Suporte Computacional à Escrita Científica em Português", desenvolvido no NILC (ICMC - USP/São Carlos), sob a orientação da Profa. Dra. Maria das Graças Volpe Nunes (orientadora) e da Profa. Dra. Sandra Maria Aluísio (co-orientadora), volta-se para a escrita de todos os componentes de um artigo científico (resumos, introduções, metodologias, resultados, discussões e conclusões) tendo como língua alvo o inglês.. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sandra Maria Aluisio - Coordenador.
2002 - 2004

Projeto Lácio-Web, Descrição: Para atender o objetivo de aumentar o volume de conteúdo em português na Web, são necessárias ferramentas automáticas de criação e manipulação desse conteúdo. Nesse cenário, o problema em torno do qual se organiza esta proposta é prover recursos computacionais e lingüísticos básicos que dão suporte à construção de ferramentas automáticas (de recuperação e extração inteligentes da informação, reconhecimento de fala, correção ortográfica e gramatical, por exemplo) para o português --- a exemplo do que ocorreu e ocorre com o inglês. Corpora são considerados o recurso mais básico para a pesquisa da língua através de métodos empíricos. O objetivo deste projeto é a construção e disponibilização de recursos de base, isto é, corpora representativos da língua e suas ferramentas associadas de apoio à anotação manual, navegação e busca, e dessa forma, começar um processo de equiparação do português ao tratamento automático de outras línguas.. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sandra Maria Aluisio - Coordenador.
2011 - Atual

Transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil, Descrição: Este projeto visa construir um ambiente computacional para suporte à transcrição fonética automática para lemas de verbetes em dicionários do Português do Brasil. Nossa hipótese norteadora é a de que a partir de um conjunto de aplicações computacionais poderá ser possível converter caracteres de unidades lexicais isoladas (verbetes) em suas unidades fonéticas correspondentes, com a aplicação de um conjunto fixo e objetivo de critérios de anotação, sem que haja para isso qualquer tipo de intervenção humana.. , Situação: Em andamento; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Coordenador.
2003 - 2007

Scipo-Farmacia, Descrição: O sistema SciPo-Farmácia foi um projeto realizado no NILC, sob a orientação da Profa. Sandra Maria Aluísio (sandra@icmc.usp.br) e do Prof. Osvaldo Novais de Oliveira Jr. (chu@if.sc.usp.br), em parceria com a Faculdade de Ciências Farmacêuticas da USP-São Paulo, particularmente com os professores Adalberto Pessoa Jr. (pessoajr@usp.br) e Ana Campa (anacampa@usp.br). A análise textual dos artigos da ferramenta foi realizada pela lingüísta Aline Maria Pacífico Manfrim e posteriormente avaliada pelo Prof. Osvaldo Novais de Oliveira Jr. e Profa. Sandra Maria Aluísio. Adaptado do projeto SciPo, trabalho de doutorado de Valéria D. Feltrim, intitulado "Suporte Computacional à Escrita Científica em Português", desenvolvido no NILC (ICMC - USP/São Carlos), sob a orientação da Profa. Dra. Maria das Graças Volpe Nunes (orientadora) e da Profa. Dra. Sandra Maria Aluísio (co-orientadora), volta-se para a escrita de todos os componentes de um artigo científico (resumos, introduções, metodologias, resultados, discussões e conclusões) tendo como língua alvo o inglês.. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sandra Maria Aluisio - Coordenador.
2002 - 2004

Projeto Lácio-Web, Descrição: Para atender o objetivo de aumentar o volume de conteúdo em português na Web, são necessárias ferramentas automáticas de criação e manipulação desse conteúdo. Nesse cenário, o problema em torno do qual se organiza esta proposta é prover recursos computacionais e lingüísticos básicos que dão suporte à construção de ferramentas automáticas (de recuperação e extração inteligentes da informação, reconhecimento de fala, correção ortográfica e gramatical, por exemplo) para o português --- a exemplo do que ocorreu e ocorre com o inglês. Corpora são considerados o recurso mais básico para a pesquisa da língua através de métodos empíricos. O objetivo deste projeto é a construção e disponibilização de recursos de base, isto é, corpora representativos da língua e suas ferramentas associadas de apoio à anotação manual, navegação e busca, e dessa forma, começar um processo de equiparação do português ao tratamento automático de outras línguas.. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sandra Maria Aluisio - Coordenador.
2002 - 2004

Projeto Lácio-Web, Descrição: Para atender o objetivo de aumentar o volume de conteúdo em português na Web, são necessárias ferramentas automáticas de criação e manipulação desse conteúdo. Nesse cenário, o problema em torno do qual se organiza esta proposta é prover recursos computacionais e lingüísticos básicos que dão suporte à construção de ferramentas automáticas (de recuperação e extração inteligentes da informação, reconhecimento de fala, correção ortográfica e gramatical, por exemplo) para o português --- a exemplo do que ocorreu e ocorre com o inglês. Corpora são considerados o recurso mais básico para a pesquisa da língua através de métodos empíricos. O objetivo deste projeto é a construção e disponibilização de recursos de base, isto é, corpora representativos da língua e suas ferramentas associadas de apoio à anotação manual, navegação e busca, e dessa forma, começar um processo de equiparação do português ao tratamento automático de outras línguas.. , Situação: Concluído; Natureza: Desenvolvimento. , Integrantes: Vanessa Marquiafável Serrani - Integrante / Sandra Maria Aluisio - Coordenador.
2015 - Atual

Desenvolvimento de recursos computacionais para tecnologias de fala, Descrição: Este projeto visa a criação de recursos computacionais para o desenvolvimento de Tecnologias de Fala, voltadas para o Português Brasileiro (Português Brasileiro). Com o desenvolvimento de algoritmos robustos para tratar bases de dados de fala, aplicações envolvendo reconhecimento ou síntese de fala, respectivamente, ASR (do inglês Automatic Speech Recognition) e TTS (do inglês Text-to-Speech), têm ganhado mais espaço em nosso cotidiano e se tornado cada vez mais precisas. No entanto, apesar de o Português Brasileiro ser a sexta língua mais falada no mundo, os recursos disponíveis para desenvolver tecnologias de fala para esse idioma ainda são escassos: há poucas bases de dados, conversores grafema-fonema e modelos acústicos ou de pronúncia. Este projeto busca, justamente, atuar nessa lacuna. Nosso propósito é desenvolver recursos computacionais de modo a incitar o desenvolvimento de tecnologias de fala para o Português Brasileiro, na indústria e na academia. Propõe-se a elaboração de quatro tipos de produtos: i) corpora de fala, ii) modelos acústicos, iii) modelos de pronúncia e iv) conversores grafema-fonema. Sobre os corpora de fala, propomos métodos de coleta e anotação de dados baseada em crawling e crowd-sourcing, que possibilitarão o desenvolvimento de recursos de fala a preços mais competitivos e acessíveis que os existentes atualmente no mercado. Técnicas do estado da arte serão empregadas na elaboração dos modelos acústicos, a exemplo de Deep Neural Networks; e dos conversores grafema-fonema, como modelos híbridos, baseados em regras manuais e aprendizado de máquina (SVM, CART, MARS). O modelo de negócio proposto centra-se em uma abordagem business-to-business (B2B), voltada para empresas de Tecnologia da Informação, Processamento de Fala e Processamento de Linguagem Natural, pensando, especialmente, no nicho de startups.. , Situação: Em andamento; Natureza: Desenvolvimento. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (4) / Doutorado: (1) . , Integrantes: Vanessa Marquiafável Serrani - Coordenador / Lucas Vinicius Avanço - Integrante / Nathalia Perussi Calcia - Integrante / Maria Érica do Nascimento Linhares - Integrante / Gustavo Augusto de Mendonça Almeida - Integrante / Christopher Dane Shulby - Integrante / Ricardo Lazarek Venturini - Integrante., Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Bolsa.
2015 - Atual

Desenvolvimento de recursos computacionais para tecnologias de fala, Descrição: Este projeto visa a criação de recursos computacionais para o desenvolvimento de Tecnologias de Fala, voltadas para o Português Brasileiro (Português Brasileiro). Com o desenvolvimento de algoritmos robustos para tratar bases de dados de fala, aplicações envolvendo reconhecimento ou síntese de fala, respectivamente, ASR (do inglês Automatic Speech Recognition) e TTS (do inglês Text-to-Speech), têm ganhado mais espaço em nosso cotidiano e se tornado cada vez mais precisas. No entanto, apesar de o Português Brasileiro ser a sexta língua mais falada no mundo, os recursos disponíveis para desenvolver tecnologias de fala para esse idioma ainda são escassos: há poucas bases de dados, conversores grafema-fonema e modelos acústicos ou de pronúncia. Este projeto busca, justamente, atuar nessa lacuna. Nosso propósito é desenvolver recursos computacionais de modo a incitar o desenvolvimento de tecnologias de fala para o Português Brasileiro, na indústria e na academia. Propõe-se a elaboração de quatro tipos de produtos: i) corpora de fala, ii) modelos acústicos, iii) modelos de pronúncia e iv) conversores grafema-fonema. Sobre os corpora de fala, propomos métodos de coleta e anotação de dados baseada em crawling e crowd-sourcing, que possibilitarão o desenvolvimento de recursos de fala a preços mais competitivos e acessíveis que os existentes atualmente no mercado. Técnicas do estado da arte serão empregadas na elaboração dos modelos acústicos, a exemplo de Deep Neural Networks; e dos conversores grafema-fonema, como modelos híbridos, baseados em regras manuais e aprendizado de máquina (SVM, CART, MARS). O modelo de negócio proposto centra-se em uma abordagem business-to-business (B2B), voltada para empresas de Tecnologia da Informação, Processamento de Fala e Processamento de Linguagem Natural, pensando, especialmente, no nicho de startups.. , Situação: Em andamento; Natureza: Desenvolvimento. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (4) / Doutorado: (1) . , Integrantes: Vanessa Marquiafável Serrani - Coordenador / Lucas Vinicius Avanço - Integrante / Nathalia Perussi Calcia - Integrante / Maria Érica do Nascimento Linhares - Integrante / Gustavo Augusto de Mendonça Almeida - Integrante / Christopher Dane Shulby - Integrante / Ricardo Lazarek Venturini - Integrante., Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Bolsa.

Prêmios

2019

Best Paper Award (2nd place), XII Brazilian Symposium in Information and Human Language Tecnology.

2014

?Best software demonstration?, Propor 2014 - International Conference on Computational Processing of Portuguese.

Histórico profissional

Endereço profissional

SPEECHTERA DESENVOLVIMENTO DE PROGRAMAS PARA COMPUTADORES LTDA, SPEECHTERA DESENVOLVIMENTO DE PROGRAMAS PARA COMPUTADORES LTDA. , Avenida Rubens Franco, Jardins de Samantha I, 13605180 - Araras, SP - Brasil, Telefone: (19) 33528778, URL da Homepage:

Experiência profissional

2015 - Atual

SPEECHTERA DESENVOLVIMENTO DE PROGRAMAS PARA COMPUTADORES LTDA

Vínculo: Co-fundadora, Enquadramento Funcional: diretora, Carga horária: 40, Regime: Dedicação exclusiva.

Outras informações:
Este projeto visa à criação de recursos computacionais para o desenvolvimento de Tecnologias de Fala, voltadas para o Português Brasileiro (Português Brasileiro). Com o desenvolvimento de algoritmos robustos para tratar bases de dados de fala, aplicações envolvendo reconhecimento ou síntese de fala, respectivamente, ASR (do inglês Automatic Speech Recognition) e TTS (do inglês Text-to-Speech), têm ganhado mais espaço em nosso cotidiano e se tornado cada vez mais precisas. No entanto, apesar de o Português Brasileiro ser a sexta língua mais falada no mundo, os recursos disponíveis para desenvolver tecnologias de fala para esse idioma ainda são escassos: há poucas bases de dados, conversores grafema-fonema e modelos acústicos ou de pronúncia. Este projeto busca, justamente, atuar nessa lacuna. Nosso propósito é desenvolver recursos computacionais de modo a incitar o desenvolvimento de tecnologias de fala para o Português Brasileiro, na indústria e na academia. Propõe-se a elaboração de quatro tipos de produtos: i) corpora de fala, ii) modelos acústicos, iii) modelos de pronúncia e iv) conversores grafema-fonema. Sobre os corpora de fala, propomos métodos de coleta e anotação de dados baseada em crawling e crowd-sourcing, que possibilitarão o desenvolvimento de recursos de fala a preços mais competitivos e acessíveis que os existentes atualmente no mercado. Técnicas do estado da arte serão empregadas na elaboração dos modelos acústicos, a exemplo de Deep Neural Networks; e dos conversores grafema-fonema, como modelos híbridos, baseados em regras manuais e aprendizado de máquina (SVM, CART, MARS). O modelo de negócio proposto centra-se em uma abordagem business-to-business (B2B), voltada para empresas de Tecnologia da Informação, Processamento de Fala e Processamento de Linguagem Natural, pensando, especialmente, no nicho de startups. (AU)

2011 - 2015

Universidade Estadual Paulista Júlio de Mesquita Filho

Vínculo: Aluna de pós-graduação, Enquadramento Funcional: Doutoranda, Carga horária: 40, Regime: Dedicação exclusiva.

2014 - 2014

Univ. de Coimbra - Instituto de Telecomunicões

Vínculo: Bolsista, Enquadramento Funcional: bolsista BEPE, Carga horária: 40, Regime: Dedicação exclusiva.

2008 - 2009

ASRLabs

Vínculo: Bolsista Fapesp TT-4, Enquadramento Funcional: Linguista, Carga horária: 40, Regime: Dedicação exclusiva.

2005 - 2007

Universidade Federal de São Carlos

Vínculo: Bolsista, Enquadramento Funcional: aluna de mestrado, Carga horária: 40, Regime: Dedicação exclusiva.

2005 - 2005

Nucleo de Ensino Profissionalizante

Vínculo: Professora, Enquadramento Funcional: Professora de Inglês, Carga horária: 20

2002 - 2004

Universidade de São Paulo

Vínculo: bolsista iniciacao cientifica, Enquadramento Funcional: linguista, Carga horária: 20

1999 - 1999

Sindicato dos Químicos de Rio Claro

Vínculo: Professora, Enquadramento Funcional: Professora de Inglês, Carga horária: 30