Alessandro Yovan Bokan Garay
M.Sc. em Ciências da Computação no Instituto Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC-USP). Pesquisador na área de Processamento da Língua Natural e Inteligência Artificial. Membro no Núcleo Interinstitucional de Lingüística Computacional (NILC). Programador Web Freelance.
Informações coletadas do Lattes em 10/11/2022
Acadêmico
Formação acadêmica
Mestrado em Ciências da Computação e Matemática Computacional
2013 - 2015
Universidade de São Paulo
Título: Sumarização Multidocumento com Base em Aspectos,Ano de Obtenção: 2015
Thiago Alexandre Salgueiro Pardo.Bolsista do(a): Fundação de Apoio à Física e à Química, FAFQ, Brasil. Palavras-chave: Sumarização Automática; Aprendizagem de Maquina; Identificação de Aspectos; Anotação de papéis semânticos; Reconhecedor de entidades nomeadas.Grande área: Ciências Exatas e da TerraGrande Área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Inteligência Artificial.
Graduação em Ciencias de la Computación
2006 - 2011
Universidad Católica San Pablo
Título: Generación Automática de Resúmenes Extractivos Utilizando Información Semántica (Sumarização Automática Extrativa Usando Informação Semântica)
Orientador: Javier Tejada Cárcamo
Idiomas
Inglês
Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.
Espanhol
Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.
Português
Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.
Áreas de atuação
Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação.
Participação em eventos
16th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing). Automatic Microaspect Identification. 2015. (Congresso).
11th International Conference on Computational Processing of Portuguese (PROPOR). PETRUS: A Rule-based Grapheme-to-Phone Converter for Brazilian Portuguese. 2014. (Congresso).
IV Congresso Internacional de Computação y Telecomunicações (COMTEL). Método não Supervisado para Sugestão de Tags Usando Informação Semântica Baseada em Conhecimento. 2012. (Congresso).
IV Congresso Internacional de Computação y Telecomunicações (COMTEL), O. Congresso Internacional de Computação y Telecomunicações. 2012. (Congresso).
Simpósio Peruano Inteligência Artificial (SPIA).Geração Automática de Resumos usando Informação Semântica. 2011. (Simpósio).
X Jornadas Peruanas de Computação (JPC). Validação de Clusters usando IEKA y SL-SOM. 2011. (Congresso).
The Alberto Mendezon Workshop on Foundations of Data Management (AMW). 2009. (Oficina).
V Jornadas Peruanas de Computação (JPC). 2006. (Congresso).
Produções bibliográficas
-
FONSECA, E. ; MEDEIROS, I. ; KAMIKAWACHI, D. ; BOKAN, ALESSANDRO Y. . Automatically Grading Brazilian Student Essays. In: International Conference on Computational Processing of the Portuguese Language, 2018, Canela, Brazil. PROPOR 2018: Computational Processing of the Portuguese Language, 2018. v. 11122. p. 170-179.
-
CONDORI, R. L. ; AVANCO, L. V. ; BALAGE FILHO, P. P. ; BOKAN, ALESSANDRO Y. ; CARDOSO, P. C. F. ; DIAS, M. S. ; NOBREGA, F. A. A. ; CABEZUDO, M. A. S. ; SOUZA, J. W. C. ; FELIPPO, A. ; PARDO, T. A. S. . A Qualitative Analysis of a Corpus of Opinion Summaries based on Aspects. In: 9th Linguistic Annotation Workshop, 2015, Denver, Colorado. Proceeginds of the 9th Linguistic Annotation Workshop (LAW IX), 2015. p. 62-71.
-
DIAS, M. S. ; BOKAN, ALESSANDRO Y. ; CHUMAN, C. ; BARROS, C. D. ; MAZIERO, E. G. ; NOBREGA, F. A. A. ; SOUZA, J. W. C. ; CABEZUDO, M. A. S. ; DELEGE, M. ; JORGE, M. L. R. C. ; SILVA, N. L. ; CARDOSO, P. C. F. ; BALAGE FILHO, P. P. ; CONDORI, R. L. ; MARCASSO, V. ; FELIPPO, A. ; NUNES, M. G. V. ; PARDO, T. A. S. . Enriquecendo o Corpus CSTNews - a Criacao de Novos Sumarios Multidocumento.. In: Proceedings of the I Workshop on Tools and Resources for Automatically Processing Portuguese and Spanish, 2014, São Carlos. Proceedings of the I Workshop on Tools and Resources for Automatically Processing Portuguese and Spanish (ToRPorEsp), 2014. p. 1-8.
-
BOKAN, ALESSANDRO Y. ; CONDORI, R. L. . Método não Supervisado para Sugestão de Tags Usando Informação Semântica Baseada em Conhecimento. In: IV Congreso Internacional de Computación y Telecomunicaciones, 2012, Lima. Proceedings of the IV Congreso Internacional de Computación y Telecomunicaciones (COMTEL), 2012.
-
GARAY, ALESSANDRO BOKAN ; ESCARCINA, RAQUEL PATINO . A GH-SOM optimization with SOM labelling and dunn index. In: 2011 11th International Conference on Hybrid Intelligent Systems (HIS 2011), 2011, Melacca. 2011 11th International Conference on Hybrid Intelligent Systems (HIS). p. 572-577.
-
BOKAN, ALESSANDRO Y. ; ESCARCINA, RAQUEL PATINO ; VALDIVIA, Y. J. T. . Validação de Clusters usando IEKA e SL-SOM. In: X Congreso da Socidade Peruana de Computação da Jornada Peruana de Computação, 2011, Pucallpa. Proceedings of the X Congreso da Socidade Peruana de Computação da Jornada Peruana de Computação (JPC 2011), 2011. p. 161-170.
-
MARQUIAFAVEL, V ; GARAY, ALESSANDRO BOKAN ; ZAVAGLIA, C. . A rule-based grapheme-to-phone converter for Brazilian Portuguese. In: International Conference on Computational Processing of Portuguese, 2014, São Carlos. PROPOR, 2014. p. 1-3.
-
Garay, Alessandro Bokan ; CARCAMO, J. L. T. . Geração Automática de Resumos usando Informação Semântica. In: Simpósio Peruano de Inteligência Artificial, 2011, Arequipa. SPIA, 2011.
-
BOKAN, ALESSANDRO Y. ; PARDO, T. A. S. . Automatic Aspect Identification: The Case of Informative Microaspects in News Texts. Research in Computing Science , 2015.
-
BOKAN, ALESSANDRO Y. ; PARDO, T. A. S. . Identificação Automática de Microaspectos em Textos Jornalísticos 2015 (Relatório Técnico).
-
BOKAN, ALESSANDRO Y. ; PARDO, T. A. S. . Identificação Automática de Macroaspectos em Textos Jornalísticos 2015 (Relatório Técnico).
Outras produções
MARQUIAFAVEL, V ; BOKAN, ALESSANDRO Y. . PETRUS: Phonetic TRanscriber for User Support. 2014.
Projetos de pesquisa
-
2016 - Atual
SIAD-AERO, Descrição: O Sistema Autônomo-Cooperativo de Planejamento e Execução de Inspeção de Ativos de Energia (SIAD-AERO) possui como objetivo principal realizar inspeção, de forma semiautônoma e cooperativa, de ativos de energia, por meio do uso de sensores embarcados em plataformas aéreas (asa fixa e rotativa) remotamente pilotadas (Remote Piloted Aircraft System - RPAS), bem como processar imagens nas bandas do visível, infravermelho e ultravioleta, detectar anomalias existentes, após a realização dos voos correspondentes, e apresentar um plano ótimo de ação (manutenção e inspeção) desses ativos (subestações ? ETDS e ETCS, linhas MT/AT, parques eólicos e PCHS), permitindo que todas as ações realizadas sejam auditáveis em todos os níveis, assim como minimizando a exposição da operadora aos diversos riscos envolvidos na atividade.. , Situação: Em andamento; Natureza: Pesquisa. , Integrantes: Alessandro Yovan Bokan Garay - Integrante / Ricardo Augusto Tavares Santos - Coordenador.
-
2014 - 2015
PETRUS: A Rule-based Grapheme-to-Phone Converter for Brazilian Portuguese, Descrição: Pɛtɾʊs é um projeto de pesquisa com o objetivo de dar suporte à transcrição fonética automática do Português Brasileiro. Por exemplo, Pɛtɾʊs converte de maneira automática uma sequência de letras como "descrédito" em uma sequência de fones [ʤiskɾɛʤɪtʊ]. Para representar a pronúncia de uma palavra, faz-se uso do IPA (International Phonetic Alphabet), um sistema alfabético de notação fonética, baseado no alfabeto latino. Além da transcrição fonética, o Pɛtɾʊs fornece aos seus usuários outras informações, tais como: identificação da sílaba tônica, divisão silábica e anotação da classe gramatical (part-of-speech). Dentro da pesquisa exploraram-se os casos dos homógrafos heterófonos (palavras com a mesma grafia, mas pronúncia diferente), tendo como saída duas palavras com diferente pronúncia e classe gramatical. Web site: http://54.232.255.128. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Mestrado acadêmico: (1) Doutorado: (2) . , Integrantes: Alessandro Yovan Bokan Garay - Integrante / Vanessa Marquiafável Serrani - Coordenador / Claudia Zavaglia - Integrante.
-
2013 - Atual
Processamento Semântico de Textos em Português Brasileiro, Descrição: Projeto de pesquisa em parceria entre o ICMC-USP e a empresa SAMSUNG Eletrônica da Amazônia LTDA, com duranção de 2 anos (dezembro de 2013-junho de 2015), cujo objetivo geral é avançar o estado da arte em processamento semântico de textos/documentos escritos em Português Brasileiro, mais especificamente, permitir a anotação de papéis semânticos e a desambiguação lexical de sentido de verbos, e, com base nesses recursos e ferramentas, construir aplicações de mineração e sumarização de textos, com especial enfoque em opiniões sobre produtos encontrados na Web. O propósito da parceria é, ao mesmo tempo, viabilizar a transferência direta de tecnologia do grupo de pesquisadores do Núcleo Interinstitucional de Linguística Computacional (NILC), sediado no ICMC-USP, à empresa SAMSUNG, e possibilitar ao grupo a aplicação de sua experiência e modelos linguístico-computacionais para processamento de língua natural em um cenário atual, real, visando à potencial criação de produtos tecnológicos.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (5) . , Integrantes: Alessandro Yovan Bokan Garay - Integrante / Roque Lopez Condori - Integrante / Marco A. Sobrevilla Cabezudo - Integrante / Sandra Maria Aulísio - Coordenador / Thiago Alexandre Salgueiro Pardo - Integrante / Maria das Graças Volpe Nunes - Integrante / Magali Sanches Duran - Integrante / Nathan Siegle Hartmann - Integrante / Lucas Vinicius Avanço - Integrante.
Prêmios
2014
PETRUS: A Rule-based Grapheme-to-Phone Converter for Brazilian Portuguese, PROPOR Software Demonstration Workshop.
Histórico profissional
Endereço profissional
-
Samsung Instituto de Desenvolvimento para a Informática. , Rua Aguaçú 171, Loteamento Alphaville Campinas, 13098321 - Campinas, SP - Brasil, Telefone: (19) 33444500, Ramal: 4580
Experiência profissional
2018 - Atual
Samsung Instituto de Desenvolvimento para a InformáticaVínculo: Celetista, Enquadramento Funcional: Senior Software Developer, Carga horária: 45, Regime: Dedicação exclusiva.
2016 - 2018
LetrusVínculo: Servidor Público, Enquadramento Funcional: Web developer and NLP Researcher, Carga horária: 40, Regime: Dedicação exclusiva.
Outras informações:
Letrus is an Brazilian Portuguese writing platform with grammar and spell checkers, word classifier, syntax analysis, flashcards, a personal database, dictionary and statistics generators accessed by students and teachers. The project is distinguished from the others by seeking technological tools that have the ability to customize learning to a large number of students by allowing to achieve quality education, without systematizing knowledge. In addition, we have created a method of tracking each student's personal development and designed personalized reports that assist teachers.
2018 - 2018
Cognitivo.aiVínculo: Bolsista, Enquadramento Funcional: Freelance Quality Assurance, Carga horária: 8
Outras informações:
System that automatically classifies labor lawsuits.
2016 - 2017
Energias Assessoria Em Sistemas de Energia e Comercio LtdaVínculo: Bolsista, Enquadramento Funcional: Software Engineer, Carga horária: 40, Regime: Dedicação exclusiva.
Outras informações:
The Autonomous-Cooperative System for Planning and Execution of Energy Assets Inspection, called SIAD-AERO, aims to conduct a semiautonomous and cooperative inspection of energy assets using embedded sensors on Remotely Piloted Aircraft Systems (RPAS), as well as processing high-definition, infrared and ultraviolet images, to detect existing anomalies after flights missions. Then, the system presents an optimal action plan for those assets, allowing all actions to be auditable at all possible levels, minimizing operator exposure risks.
2015 - 2016
Deutsches Forschungszentrum für Künstliche IntelligenzVínculo: Bolsista, Enquadramento Funcional: Pesquisador Científico, Carga horária: 40
Outras informações:
Desenvolvedor do módulo de "análise de texto" no projeto RESCUER. Dentro do projeto RESCUER, a tarefa de "análise de texto" pertence a uma tarefa maior denominada "análise de dados". A ideia principal do projeto RESCUER é fazer que os módulos que analisam as informações (imagem, vídeo e texto) auxiliem aos centros de comando (bombeiros, polícia, etc) durante uma emergência fornecendo uma descrição multimédia do acidente. Basicamente, o módulo de análise de texto visa extrair as informações básicas presentes nos textos enviados pelos usuários (testemunhas), que são úteis para os usuários finais (centro de comando, polícia, bombeiros, forças militares, etc) Site: http://www.rescuer-project.org
2015 - 2015
Centro de Autoria e Cultura LTDAVínculo: Celetista, Enquadramento Funcional: Cientista da Informação, Carga horária: 25
Outras informações:
Desenvolvedor Web e pesquisador no projeto "Letrus". O "Letrus" é um editor online que identifica erros gramaticais e ortográficos. É uma ferramenta de assistencia à escrita. O objetivo principal é de ensinar às pessoas a escrever corretamente diferentes tipos de textos como livros, redações, notícias, dissertações, etc. Cargo: Technical Leader and Web developer (back-end) Tecnologias Web (fron-end/back-end): HTML, Jquery, CSS, JavaScript, Ajax, Redis. Tecnologias NLP: nlpnet (POS tagger), UNITEX (Portuguese dictionary) Programming language/Framework: Python/Django. Site: http://letrus.com.br
2013 - 2015
Universidade de São PauloVínculo: Bolsista, Enquadramento Funcional: Pesquisador de Mestrado, Carga horária: 40, Regime: Dedicação exclusiva.
Outras informações:
O objetivo principal do mestrado é investigar métodos de Sumarização Automática Multidocumento usando unidades básicas de informação de importância para o usuário final. Tais informações são fornecidas pelos aspectos informativos presentes nos textos de origem (o que aconteceu, quando aconteceu, onde aconteceu, como aconteceu, quem foram os afetados etc.), que ajudarão na seleção de conteúdo para a formação de sumários coerentes. Portanto, visa-se identificar automaticamente, por meio de um classificador, aspectos informativos em textos utilizando técnicas de aprendizado de máquina, e criar pelo menos um método de seleção de conteúdo com base em padrões organizacionais de aspectos em sumários. Cabe ressaltar que este trabalho de mestrado forma parte do projeto "Processamento Semântico de Textos em Português Brasileiro", em parceria com a empresa SAMSUNG Eletrônica da Amazônia LTDA.
2013 - 2013
Universidade de São PauloVínculo: Bolsista, Enquadramento Funcional: Assistente de Professor, Carga horária: 12
Outras informações:
Assisnte de professor da disciplina "Introdução à Compilação"
2013 - 2013
Universidade de São PauloVínculo: Bolsista, Enquadramento Funcional: Desenvolvedor de Software, Carga horária: 20
Outras informações:
Criação de um algoritmo pare gerar árvores de relações RST (Rhetorical Structure Theory). Esse algoritmo foi criado para auxiliar a ferramenta "Dizer 2.0". Dita ferramenta encontra-se no NILC (Núcleo Interinstitucional de Lingüística Computacional) no website: http://www.nilc.icmc.usp.br/nilc/index.php/tools-and-resources. Para desenvolver o algoritmo utilizou-se a teoria da Programação Dinâmica. Linguagem de Programação: Python.
2012 - 2013
Universidad Peruana de Ciencias AplicadasVínculo: Celetista, Enquadramento Funcional: Web developer (back-end/front-end), Carga horária: 40, Regime: Dedicação exclusiva.
Outras informações:
Web project developed to create job opportunities for students and professionals of the "Universidad Peruana de Ciencias Aplicadas (UPC)". All university members can apply to job offers published by national and international companies. Position: Project leader and Web developer (back-end) Web technologies: HTML, Jquery, CSS, JavaScript, Ajax, Responsive, REST, NLTK, PostgresSQL, Redis, Bootstrap. Programming language and framework: Python/Django. Web page: http://bolsadetrabajo.upc.edu.pe/
2012 - 2012
LaMula.peVínculo: Celetista, Enquadramento Funcional: Web developer (back-end), Carga horária: 40, Regime: Dedicação exclusiva.
Outras informações:
Web developer (back-end/front-end) from a news blog "La Mula". The system is divided in many modules (blogs, posts, tags, users, comments, accounts, etc.) with an API communication. Position: Web developer (back-end) Web technologies: HTML, Jquery, CSS, JavaScript, Ajax, Responsive, REST, NLTK, RabbitMQ, PostgresSQL, MongoDB, Redis. Programming language and Framework: Python/Django. Web page: http://lamula.pe.
2010 - 2010
Universidad Católica San PabloVínculo: Bolsista, Enquadramento Funcional: Assistente de Professor, Carga horária: 15
Outras informações:
Assistente de professor da disciplina "Introdução á Internet".
2010 - 2010
Universidad Católica San PabloVínculo: Bolsista, Enquadramento Funcional: Desenvolvedor de Software, Carga horária: 40, Regime: Dedicação exclusiva.
Outras informações:
Sistema automático que presenta as informações do Curriculum Vitae (CV) dos professores ou funcionarios da instituição acadêmica. Posição: Software Developer Área: Tecnologias da Informação Programming language and framework: Visual Basic/.NET
Criando um monitoramento
Nossos robôs irão buscar nos nossos bancos de dados todos os processos de Alessandro Yovan Bokan Garay e sempre que o nome aparecer em publicações dos Diários Oficiais, avisaremos por e-mail e pelo painel do usuário
Criando um monitoramento
Nossos robôs irão buscar nos nossos bancos de dados todas as movimentações desse processo e sempre que o processo aparecer em publicações dos Diários Oficiais e nos Tribunais, avisaremos por e-mail e pelo painel do usuário
Confirma a exclusão?