Yania Molina Souto

Possui graduação em Engenharia em Ciência da Computação - Universidad de las Ciencias Informáticas (2007), Mestrado em Bioinformática pelo Instituto Superior de Tecnologías e Ciências Aplicadas (2010) e Doutorado pelo Laboratório Nacional de Computação Científica (2018). Tem como interesse de pesquisa à análise de dados, com ênfase em gerenciamento de dados espaço-temporais, gerenciamento de dados em redes de sensores. Possui experiência em técnicas de Deep Learning, ensemble learning e otimização de sistemas de memória compartilhada.

Informações coletadas do Lattes em 17/01/2024

Acadêmico

Formação acadêmica

Doutorado em Modelagem Computacional

2013 - 2018

Laboratório Nacional de Computação Científica
Título: Uma abordagem espaço-temporal para aprendizagem em conjunto usando redes ConvLSTM
Fabio André Machado Porto. Coorientador: Ana María Moura de Carvalho. Bolsista do(a): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, CAPES, Brasil.

Mestrado em Mestrado em Bioinformática

2008 - 2010

Instituto Superior de Tecnologias y Ciencias Aplicadas
Título: Desarrollo de modelos QSAR utilizando Programación Genética y Árboles de Regresión., Ano de Obtenção: 2010
Orientador: PhD Ramón Carrasco Velar
Palavras-chave: QSAR; QSRP; Inteligencia Artificial; Diseño racional de fármacos.Grande área: Ciências BiológicasGrande Área: Engenharias / Área: Engenharia Biomédica / Subárea: Bioinformática. Grande Área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Inteligencia Artificial.

Graduação em Engenharia em Ciência da Computação

2002 - 2007

Universidad de Las Ciencias Informáticas
Título: Módulo de predicción de actividad biológica anticancerígena de compuestos orgánicos, partiendo de fragmentos, utilizando Programación Genética.
Orientador: Dr. Ramón Carrasco Velar

Pós-doutorado

2018 - 2020

Pós-Doutorado. , Laboratório Nacional de Computação Científica, LNCC, Brasil. , Bolsista do(a): Fundação de Apoio ao Desenvolvimento da Computação Cientifica, FACC, Brasil. , Grande área: Ciências Exatas e da Terra, Grande Área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Análise de dados.

Formação complementar

2014 - 2014

Estatística. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2014 - 2014

Termodinâmica. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2014 - 2014

Modelagem Baseada em Dados. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2014 - 2014

Introdução ao DNA e Proteínas. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2014 - 2014

Inteligência Artificial. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Álgebra Linear. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Ciência da Computação: Algoritmos I. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Bioquímica. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Métodos Numéricos. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Arquitetura, Projeto e Implementação de Sistemas. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Ciência da Computação: Estruturas de Dados e Aplic. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Bioinformática - Desenvolvimento de Webapps. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Banco de Dados. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Processamento Paralelo. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Processamento Paralelo. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2013 - 2013

Fundamentos de Modelagem. (Carga horária: 40h). , Laboratório Nacional de Computação Científica, LNCC, Brasil.

2008 - 2009

Especialização em Fundamentos da Docência no Ensin. (Carga horária: 64h). , Universidad de las Ciencias Informáticas, UCI, Cuba.

Idiomas

Bandeira representando o idioma Inglês

Compreende Razoavelmente, Fala Razoavelmente, Lê Razoavelmente, Escreve Razoavelmente.

Bandeira representando o idioma Espanhol

Compreende Bem, Fala Bem, Lê Bem, Escreve Bem.

Bandeira representando o idioma Português

Compreende Bem, Fala Razoavelmente, Lê Bem, Escreve Razoavelmente.

Áreas de atuação

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Análise de dados.

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Inteligencia Artificial.

Grande área: Ciências Exatas e da Terra / Área: Ciência da Computação / Subárea: Metodologia e Técnicas da Computação/Especialidade: Banco de Dados.

Participação em eventos

BeyondMR2018. Automatic Caching Decision for Scientific Dataflow Execution in Apache Spark. 2018. (Congresso).

IJCNN. A Spatiotemporal Ensemble Approach to Rainfall Forecasting. 2018. (Congresso).

IX BRESCI. Managing Uncertainty in Spatio-Temporal Series. 2015. (Congresso).

XIX International Chemistry Conference. Definition of a descriptor language of chemical structures.. 2008. (Congresso).

XXXIII QUITEL International Conference. Platform for biological activity prediction of organic compounds.. 2007. (Congresso).

Produções bibliográficas

  • CASTRO, R. ; SOUTO, YANIA MOLINA ; Eduardo Ogasawara ; PORTO, F. A. M. ; BEZERRA, EDUARDO . STConvS2S: Spatiotemporal Convolutional Sequence to Sequence Network for weather forecasting. NEUROCOMPUTING , v. 426, p. 285-298, 2020.

  • SILVA, D. N. R. ; Adolfo Simões ; Carlos Cardoso ; OLIVEIRA, D. E. M. ; RITTMEYER, J. N. ; Klaus Wehmuth ; Hermano Lustosa ; PEREIRA, R. S. ; PORTO, FABIO ; Eduardo Ogasawara ; Artur Ziviani ; SOUTO, YANIA MOLINA . A conceptual vision toward the management of Machine Learning models. In: ER-Forum 2019 and ER Poster & Demos Session 2019, 2019, Salvador. ER-Forum 2019 and ER Poster & Demos Session 2019, 2019. v. 2469. p. 17.

  • GOTTIN, VINICIUS M. ; RITTMEYER, JOÃO G. ; PACHECO, EDWARD ; DIAS, JONAS ; CIARLINI, ANGELO E. M. ; COSTA, BRUNO ; VIEIRA, WAGNER ; SOUTO, YANIA M. ; PIRES, PAULO ; PORTO, FABIO . Automatic Caching Decision for Scientific Dataflow Execution in Apache Spark. In: the 5th ACM SIGMOD Workshop, 2018, Houston. Proceedings of the 5th ACM SIGMOD Workshop on Algorithms and Systems for MapReduce and Beyond - BeyondMR'18, 2018. p. 1.

  • SOUTO, YANIA MOLINA ; PORTO, FABIO ; MOURA, ANA MARIA ; BEZERRA, EDUARDO . A Spatiotemporal Ensemble Approach to Rainfall Forecasting. In: 2018 International Joint Conference on Neural Networks (IJCNN), 2018, Rio de Janeiro. 2018 International Joint Conference on Neural Networks (IJCNN), 2018. p. 1-581.

  • SOUTO, Y. M. ; MOURA, A. M. C. ; Fabio Porto . Managing Uncertainty in Spatio-time series. In: 9o Brazilian eScience Workshop, 2015, Recife. Anais do XXXV Congresso da Sociedade Brasileira de Computação 2015, 2015. v. 1. p. 1-8.

  • R. Pereira ; SOUTO, YANIA MOLINA ; Anderson Chaves ; Rocio Zorilla ; Brian Tsan ; Florin Rusu ; Eduardo Ogasawara ; Artur Ziviani ; PORTO, F. A. M. . DJEnsemble: a Cost-Based Selection and Allocation of a DisjointEnsemble of Spatio-temporal Models. PATTERN ANALYSIS AND APPLICATIONS , 2021.

  • SOUTO, Y. M. ; Fabio Porto ; MOURA, A. M. C. . MANAGING UNCERTAINTY IN SPATIO-TEMPORAL SERIES. 2015. (Apresentação de Trabalho/Congresso).

Outras produções

SOUTO, Y. M. ; Cuadrado. M . Algoritmo distribuido de Programación Genética para diseo de modelos QSAR en compuestos orgánicos.. 2010.

SOUTO, Y. M. ; Rosa. V ; Rodriguez. Y . Lenguaje descriptor de estructuras químicas en bases de datos.. 2008.

SOUTO, Y. M. ; Vergara. Y . Módulo de búsqueda de estructuras químicas en 2D.. 2008.

Projetos de pesquisa

  • 2018 - 2020

    Gypscie: Transformando Dados em Conhecimento, Descrição: Descrição: O objetivo deste projeto é aliar técnicas de Aprendizado de Máquina a Bancos de Dados. Esperamos produzir sinergias entre essas duas áreas. Por um lado, técnicas de ML podem auxiliar na eficiência de bancos de dados. POr exemplo, o trabalho desenvolvido em "Learned Indexes" substituem estruturas de indexação por funções. Por outro lado, pode-se estender a capacidade de técnicas de IA como novos objetos de BDs tais como funções de predição. , Situação: Concluído; Natureza: Pesquisa. , Integrantes: Yania Molina Souto - Integrante / PIRES, PAULO - Integrante / Fabio Andre Machado Porto - Coordenador / Eduardo Ogasawara - Integrante / Artur Ziviani - Integrante.

  • 2017 - 2018

    Data Valuation, Descrição: Valuing digital data is complex because the data is intangible and, in accounting terms, does not follow the usual rules. However, it has a demonstrable value in terms of usage. The valuation of data is the basis to motivate each owner to take actions in their companies or institutions to improve their information so that these improvements can be measured and rewarded. This study aims to answer questions such as ?how the data can be valuated on the technical perspective??, "which processes can improve or decrease the value of the data?" and, thus, identifying the state-of-the-art in this regard. With the advent of Big Data, it is increasingly challenging for scientists, engineers, and economists valuing digital data. The value of data can be established according to different but complementary perspectives, that is, economic and technical. On the economic point of view, data can be managed and accounted with the same or similar rigor and formality as other traditional assets (e.g., financial, physical, intangible, human capital). This allows, for example, valuing datasets for purchasing, for insurance, or for understanding the value of analytic models. When considering the technical perspective, valuing digital data encompasses other aspects, such as, reutilization (the more the data is reused, the more valuable it is) or aggregation (the value of the data is proportional to the aggregation of data that is required by other computational processes). Independent of the perspective on which the value of data is calculated, the question ?how to value a given digital data?? is complex. This study focuses on the technical perspective of digital data valuation aiming to establish the state-of-the-art in this field to identify gaps that have not been explored yet. A partnership with the company Dell-EMC Brazil.. , Situação: Concluído; Natureza: Pesquisa. , Integrantes: Yania Molina Souto - Integrante / Fabio Andre Machado Porto - Coordenador.

  • 2016 - 2018

    Gerência e Análise de Grandes Volumes de Dados Científicos, Descrição: Este projeto estrutura as atividades de pesquisa, ensino e inovação sendo desenvolvidas no laboratório Data Extreme Lab (DEXL), membro do Laboratório Nacional de Computação Científica (LNCC), instituto do Ministério da Ciência, Tecnologia e Inovação (MCTI), e coordenado pelo proponente desta proposta. Em consonância com o Plano Diretor da Unidade (2011-2015), o DEXL, fundado em 2010, se propõe a desenvolver atividades de pesquisa e inovação na área de gerência e análise de grandes volumes de dados científicos, em cooperação com instituições nacionais e internacionais. Neste sentido, foram estabelecidas cooperações científicas em áreas tais como: astronomia (laboratório LIneA ? Observatório Nacional); Ciência do Esporte, Laboratório Olímpico (Comitê Olímpico Brasileiro), Biologia, Projeto Ecológico de Longa Duração ? Guanabara, e Medicina Apoiada por Ciência da Computação, INCT-MACC, além de petróleo e gás, em parceria com a empresa EMC Research Brazil. Além de oferecer apoio tecnológico a estes projetos, importantes linhas de pesquisa foram sendo desvendadas e exploradas em trabalhos de Doutorado, Mestrado e Iniciação Científica, produzindo resultados em publicações, patentes e formação de recursos humanos. Ainda mostrando aderência aos objetivos da instituição, contribuímos como coordenadores e participantes de projetos de cooperação internacional com grupos de pesquisa na França. Pretendemos nessa colaboração, preparamo-nos para explorar o novo super-computador peta-flópico recém instalado no LNCC. Apesar de ainda constar como superficial em nossos trabalhos, alguns de nossos resultados [Costa et al. 2012, Lustosa et al. 2015] pretendemos que sejam estendidos para este novo desafio. Neste sentido, o objetivo deste projeto é de solidificar os avanços alcançados nestes últimos três anos e colocando o laboratório DEXL como importante fonte de pesquisa e inovação em nossa área. A proposta se enquadra na gerência e análise de grandes volumes de dados em apoio à nova Ciência de Dados.. , Situação: Concluído; Natureza: Pesquisa. , Integrantes: Yania Molina Souto - Integrante / Fabio Andre Machado Porto - Coordenador.

Projetos de desenvolvimento

  • 2019 - Atual

    ESTUDO SOBRE A PREVISIBILIDADE DA CHUVA NA ESCALA SUB-SAZONAL PARA GRANDES BACIAS HIDROGRÁFICAS NO BRASIL., Descrição: Projeto de pesquisa em parceria com o IAG/USP e a empresa ALUPAR para um estudo sobre a previsibilidade da chuva na escala sub-sazonal para grandes bacias hidrográficas no Brasil. Os resultados da pesquisa serão usados para otimização de recursos operacionais relacionados com geração de energia e qualificação do processo de previsão do preço da mesma.. , Situação: Em andamento; Natureza: Desenvolvimento. , Integrantes: Yania Molina Souto - Integrante / MARIA ASSUNCAO FAUS DA SILVA DIAS - Coordenador.

  • 2021 - Atual

    Estudo das causas climáticas associadas aos extremos de vento e geração de energia eólica no litoral do Maranhão/Piauí e investigação sobre sua previsibilidade., Situação: Em andamento; Natureza: Desenvolvimento. , Integrantes: Yania Molina Souto - Integrante / MARIA ASSUNCAO FAUS DA SILVA DIAS - Coordenador.

  • 2019 - Atual

    ESTUDO SOBRE A PREVISIBILIDADE DA CHUVA NA ESCALA SUB-SAZONAL PARA GRANDES BACIAS HIDROGRÁFICAS NO BRASIL., Descrição: Projeto de pesquisa em parceria com o IAG/USP e a empresa ALUPAR para um estudo sobre a previsibilidade da chuva na escala sub-sazonal para grandes bacias hidrográficas no Brasil. Os resultados da pesquisa serão usados para otimização de recursos operacionais relacionados com geração de energia e qualificação do processo de previsão do preço da mesma.. , Situação: Em andamento; Natureza: Desenvolvimento. , Integrantes: Yania Molina Souto - Integrante / MARIA ASSUNCAO FAUS DA SILVA DIAS - Coordenador.

Histórico profissional

Endereço profissional

  • RHAMA, RHAMA. , Avenida Cristóvão Colombo - 3084/702, Floresta, 90560002 - Porto Alegre, RS - Brasil, Telefone: (24) 22336024

Experiência profissional

2018 - 2020

Laboratório Nacional de Computação Científica

Vínculo: Bolsista, Enquadramento Funcional: Pôs-doutorado, Carga horária: 20

2013 - 2018

Laboratório Nacional de Computação Científica

Vínculo: Bolsista, Enquadramento Funcional: Estudante de Doutorado, Regime: Dedicação exclusiva.

Atividades

  • 03/2013

    Pesquisa e desenvolvimento, DEXL.,Linhas de pesquisa

2007 - 2012

Universidad de Las Ciencias Informáticas

Vínculo: Servidor Público, Enquadramento Funcional: Professor, Carga horária: 40, Regime: Dedicação exclusiva.

Atividades

  • 09/2007 - 07/2012

    Ensino, Engenharia em Ciência da Computação, Nível: Graduação,Disciplinas ministradas, Análise Numérica, Cálculo I,II e III, Programação em MATLAB

  • 09/2007 - 09/2009

    Pesquisa e desenvolvimento, Facultad de Bioinformática.,Linhas de pesquisa

2016 - 2018

DELL-EMC

Vínculo: Bolsista, Enquadramento Funcional: Pesquisador bolsista, Carga horária: 20

2021 - Atual

Rhama

Vínculo: Terceirizado, Enquadramento Funcional: Terceirizado, Carga horária: 30

Outras informações:
Cientista de Dados

2020 - Atual

CDW Amplified Services

Vínculo: Terceirizado, Enquadramento Funcional: Terceirizado, Carga horária: 10

Outras informações:
Looker Consulting Partner (Delivery Verified)