-
2020 - Atual
Análise hierárquica de imagens e vídeos a partir de sua representação em grafos, Descrição: Técnicas de processamento de imagem e vídeo a partir de representações hierárquicas visam explorar a representação visual de dados considerando um conjunto de segmentações. Estas segmentações descrevem o conteúdo visual em diferentes níveis de detalhe e são produzidas de tal maneira que os níveis mais finos produzem níveis mais grosseiros a partir da união de regiões, produzindo deste modo uma hierarquia de partições. Estas estruturas de dados têm sido aplicadas com sucesso em áreas como sensoriamento remoto, detecção de objetos ou até mesmo na melhoria do reconhecimento de ação. Existem várias maneiras para se computar estas hierarquias de partições, no entanto algoritmos eficientes e eficazes são difíceis de desenvolver devido às informações semânticas necessárias para a segmentação. Na verdade, vários métodos de segmentação que estão no estado-da-arte são dependentes do cálculo de ``bons'' gradientes. Além disto, métodos não-hierárquicos podem produzir boas segmentações graças à métrica usada para calcular a similaridade entre duas regiões. Estes métodos podem ser transformados, sem perda de qualidade, em métodos hierárquicos, o que insere novas propriedades nestes métodos.
O objetivo deste estudo é avançar na área da hierarquia de partições usando grafos como sua principal representação, considerando os aspectos de eficiência, qualidade, hierarquização e interatividade, assim como usar a informação hierárquica para auxiliar na extração de informação. Graças ao uso de grafos, a análise hierárquica não fica restrita a imagens e vídeos, podendo ser portanto um estudo genérico para qualquer tipo de dado. Entretanto, serão dadas ênfases a imagens e vídeo, e portanto, a transformação de algoritmos clássicos de segmentação em algoritmos hierárquicos, em particular sem exigência de refinamento de parâmetro, poderá ser considerado um dos pontos importantes deste estudo. Espera-se ainda investigar estratégias para visualizar hierarquias tanto em imagens quanto em vídeos, como os mapas de saliência. Finalmente, estudar critérios de comparação entre hierarquias e de combinação de hierarquias por meio de operações envolvendo seus mapas de saliência ou por meio de aprendizado. Os resultados destes estudos serão utilizados para resolver diversas aplicações, como o reconhecimento de ações, detecção de pornografia, descoberta de motifs e rotulação de regiões.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Carolina Stephanie Jerônimo Almeida - Integrante / Isabela Borlido Barcelos - Integrante / PATROCÍNIO JR, ZENILTON K.G. - Integrante / thales rodrigues - Integrante., Financiador(es): Pontifícia Universidade Católica de Minas Gerais - Bolsa.
-
2020 - Atual
Learning on graph-based hierarchical methods for image and multimedia data, Descrição: Methods of image, video and multimedia analysis which use hierarchical representation aim to explore the visual representation as region-oriented scale-space. This representation is a set of graph representations at different detail levels in which the representation at finer levels are nested with respect to those at coarser levels producing a hierarchy of partitions. This kind of data structure has been sucessfully applied to remote sensing, object detection and human action recognition. Despite the several ways for computing hierarchies of partitions, developing efficient and effective methods is not an easy task due to the semantic information which is needed for a segmentation.
Another interesting issue is how to merge different hierarchical informations obtained from different data. The key to find a solution is using graphs for representing hierarchies and taking advantage of their latest advances in theory and practice. Concerning a new hot topic, organizing collections of multimedia items as a graph has recently received significant attention. Recent approaches depart from the
k-nearest neighbor (k-nn) approaches that have long been dominant as a
mean to organize multimedia items, propagate annotations from one item
to the other or simply facilitate navigation and interactive exploration
of the data.
From a viewpoint of applications, such hierarchical informations have potential for providing us somewhat hierarchical features. It would be interesting to study what kinds of hierarchical features can be extracted from each data, and how to extract them. Finally, we need to consider dealing with image, video and multimedia data simultaneously, namely a larger size of data.
Naturally, we will encounter algorithmic problems, which should be also solved by adapting our methods to such large data. With the goal of advancing the state of the art, this associted team targets significant contributions in the following challenges: (i) graph-based image and video segmentation; (ii) graph-based image and video cosegmentation; (iii) multimodal person discovery from hierarchical label propagation; and (iv) {graph-based multimodal image and video segmentation.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (1) / Doutorado: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Guillaume Gravier - Integrante / Simon Malinowski - Coordenador / Ewa Kijak - Integrante., Financiador(es): Centre de recherche Inria Rennes - Bretagne Atlantique - Cooperação.Número de orientações: 1
-
2019 - Atual
Hierarchical Graph-based Analysis of Image, Video and Multimedia Data, Descrição: CAPES/COFECUB: Methods of image, video and multimedia analysis which use hierarchical representation aim to explore the visual representation as region-oriented scale-space. This representation is a set of graph representations at different detail levels in which the representation at finer levels are nested with respect to those at coarser levels producing a hierarchy of partitions. This kind of data structure has been sucessfully applied to remote sensing, object detection and human action recognition. Despite the several ways for computing hierarchies of partitions, developing efficient and effective methods is not an easy task due to the semantic information which is needed for a segmentation. In fact, the state-of-the-art segmentation methods depend on the good gradients to produce good results. Furthermore, non-hierarchical methods could produce good segmentation results thanks to the (dis)similarity measure used for merging two regions, which can be transformed, without loss of quality, into hierarchical methods which incorporate some new properties. Thus, the main goal of this study is to advance in the state-of-the-art on \textit{hierarchy of partitions} taking into account aspects of efficiency, quality, making hierarchical and interactivity, as well as the use of hierarchical information to help in the information extraction and the label propagation.
Moreover, we will investigate hierarchical visualization of all, image, video and multimedia, by using countour saliency maps. Finally, we will explore the criteria for hierarchical comparison and for hierarchical combination taking into account their contour saliency maps and learning methods. The results of these studies will be used for solving several applications like human action recognition, pornography detection, image and video region labeling, multimedia label propagation, image and video inpainting, among others. We will build upon existing research and skills at LIGM, IRISA, Grenoble INP, UNICAMP, PUC Minas and UFMG to develop collaborative work exploiting complementarity of these institutions.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (6) / Mestrado acadêmico: (4) / Doutorado: (6) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Arnaldo de Albuquerque Araújo - Integrante / Alexandre Falcão - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Jean Cousty - Integrante / Yukiko Kenmochi - Integrante / Laurent Najman - Integrante / Guillaume Gravier - Integrante / Jefersson Alex dos Santos - Integrante / Helio Pedrini - Integrante / Simon Malinowski - Integrante., Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Cooperação / COFECUB - Cooperação.
-
2018 - 2019
Análise e processamento hierárquico de imagens e vídeos, Descrição: O objetivo deste estudo é avançar na área da hierarquia de partições, considerando os aspectos de eficiência, qualidade e hierarquização, assim como usar a informação hierárquica para auxiliar na extração de informação. A transformação de algoritmos clássicos de segmentação em algoritmos hierárquicos, em particular sem exigência de refinamento de parâmetro, poderá ser considerado um dos pontos importantes deste estudo. Espera-se ainda investigar estratégias para visualizar hierarquias tanto em imagens quanto em vídeos, como os mapas de saliência. Finalmente, estudar critérios de comparação entre hierarquias. Os resultados destes estudos serão utilizados para resolver diversas aplicações, como o reconhecimento de ações, detecção de pornografia, descoberta de motifs e rotulação de regiões.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador., Financiador(es): Pontifícia Universidade Católica de Minas Gerais - Bolsa.
-
2018 - 2019
Mapas de saliências para representação de segmentação de vídeo, Descrição: Estudos de métodos de visualização da segmentação hierárquica de vídeo. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador., Financiador(es): Pontifícia Universidade Católica de Minas Gerais - Bolsa.
-
2018 - Atual
Transforming multimedia data for indexing and retrieval purposes (TRANSFORM), Descrição: TRANSFORM focará na transformação de dados multimídia em representações compactas para fins de indexação e recuperação contribuindo em: representações de dados temporais e objetos 3D; representações que preservem a medida de similaridade em séries temporais; e representações em espaços multimodais.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) / Doutorado: (2) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Arnaldo de Albuquerque Araújo - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Kleber Jacques F. de Souza - Integrante / Guillaume Gravier - Integrante / Benjamin Bustos - Integrante / Simon Malinowski - Integrante / Wladmir Cardoso Brandao - Integrante., Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Auxílio
financeiro.
-
2017 - 2018
Inpainting baseado em análise de grafos, Descrição: Estudo de métodos de recuperação de imagens digitais por meio de análise de grafos e de métodos de segmentação.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador., Financiador(es): Pontifícia Universidade Católica de Minas Gerais - Bolsa.
-
2016 - 2017
Processamento hierárquico de imagens e vídeos, Descrição: Estudo de métodos de segmentação hierárquica de imagens e vídeo. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador., Financiador(es): Pontifícia Universidade Católica de Minas Gerais - Bolsa.
-
2016 - Atual
Representação hierárquica de informações multimídia para análise de imagem e vídeo, Descrição: A segmentação hierárquica de imagens e vídeos produz um espaço-escala orientado à região, i.e., um conjunto de segmentações em diferentes níveis de detalhe no qual as segmentações com detalhes mais finos são incluídas nas de níveis mais grossos. Aplicações como a rotulação de cenas (ou regiões), assim como, o reconhecimento de ações podem basear-se nas informações destes diferentes níveis com o intuito de melhorar a qualidade do reconhecimento, além de facilitar sua rotulação, em contraponto ao uso da informação extraída em somente uma escala. Muitos algoritmos de segmentação de vídeos, tais como algoritmos de junção de regiões, baseiam-se em um critério de junção que não produz uma hierarquia, e pode necessitar de uma parametrização difícil. O objetivo deste estudo é contribuir na área de representação hierárquica juntando-se a um projeto já aprovado, neste sentido, espera-se abordar a extração de informação em imagens e vídeo para sua utilização em algumas aplicações. Portanto, estas contribuições se juntarão aquelas do projeto CAPES/PVE cujo intuito é investigar formas de transformar algoritmos clássicos de segmentação em algoritmos hierárquicos, em particular sem exigência de refinamento de parâmetro, considerando tanto métodos interativos quantos não interativos. Espera-se ainda investigar estratégias para visualizar hierarquias tanto em imagens quanto em vídeos, como os mapas de saliência. Finalmente, estudar critérios de comparação entre hierarquias.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador., Financiador(es): Fundação de Amparo à Pesquisa do Estado de Minas Gerais - Auxílio
financeiro.
-
2016 - Atual
Processamento hierárquico de imagens e vídeos, Descrição: O objetivo deste estudo é avançar na área da hierarquia de partições, considerando os aspectos de eficiência, qualidade, hierarquização e interatividade, assim como usar a informação hierárquica para auxiliar na extração de informação. A transformação de algoritmos clássicos de segmentação em algoritmos hierárquicos, em particular sem exigência de refinamento de parâmetro, poderá ser considerado um dos pontos importantes deste estudo. Espera-se ainda investigar estratégias para visualizar hierarquias tanto em imagens quanto em vídeos, como os mapas de saliência. Finalmente, estudar critérios de comparação entre hierarquias. Os resultados destes estudos serão utilizados para resolver diversas aplicações, como o reconhecimento de ações, detecção de pornografia e descoberta de motifs. Serão estudadas ainda métricas de avaliação, tanto para a segmentação quanto para o reconhecimento.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) / Doutorado: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Arnaldo de Albuquerque Araújo - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Jean Cousty - Integrante / Laurent Najman - Integrante / KENMOCHI, YUKIKO - Integrante., Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio
financeiro.
-
2015 - Atual
Explorando a Coerência na Construção de Vocabul ário Multimodal para Recuperação de Tomadas de Vídeo, Descrição: Recentemente, o volume de pesquisas envolvendo recuperação de vídeo em grandes bases de dados têm experimentado um grande aumento. Isso se deve ao fato da crescente popularidade da utilização de vídeos pelos diversos setores da sociedade em razão da facilidade proporcionada pelos recentes avanços tecnológicos. Em face da utilização crescente de sistemas para recuperação de vídeos, surge, então, a necessidade de se adotar mecanismos para o armazenamento e recuperação eficientes desse tipo de mídia. A forma mais comumente implementada para consulta desses sistemas de recuperação é por meio da utilização de palavras-chave, em que a consulta é realizada por meio de anotações e/ou metadados cadastrados previamente para cada um dos vídeos da base de dados. Todavia, devido a alta complexidade da informação áudio-visual e ao grande volume de dados a serem manipulados, este tipo de consulta acaba não sendo eficaz para recuperação de vídeos relevantes. Alternativamente, a busca de vídeos baseada em conteúdo (CBVR - Content-Based Video Retrieval) procura realizar a recuperação de vídeos relevantes sem a necessidade da geração e armazenamento de anotações e/ou metadados sobre os mesmos. Mesmo assim, a busca de vídeos baseada em conteúdo não é fácil de ser realizada, pois o conteúdo de um vídeo não é completamente estruturado o que torna difícil sua manipulação, armazenamento e recuperação de forma eficiente. Por outro lado, na última década, abordagens baseadas no modelo "bag of words" (BoW) -- amplamente utilizado na recuperação de informação textual -- têm apresentado um bom desempenho na recuperação de informação multimídia, em especial, quando aplicadas a imagens. O presente projeto de pesquisa pretende investigar um modelo "bag of words" que explore a coerência entre as palavras visuais e acústicas durante a construção de um vocabulário multimodal a ser empregado na recuperação de tomadas de vídeo. Um vocabulário multimodal coerente utiliza-se do cálculo da co-ocorrência de múltiplos descritores acústicos e visuais para descrever as informações áudio-visuais contidas em uma tomada de vídeo. Assim, através do fortalecimento de restrições de coerência entre diferentes espaços de características, esse vocabulário multimodal coerente busca tornar o modelo "bag of words" mais discriminativo e robusto. Tal vocabulário será composto por "histogramas de palavras visuais" ("bag of visual words" - BoV) e por "histogramas de palavras acústicas" ("bag of audio words" - BoA), que por sua vez serão armazenados em estruturas de acesso métricas ba\-sea\-das em árvores -- tais como, M-tree, Slim-tree, M2-tree, Slim2-tree. Espera-se, assim, melhorar não só a qualidade dos resultados das consultas, mas também o tempo de resposta das mesmas, quando comparado ao da abordagem tradicional de armazenamento por meio de arquivos invertidos. Além disso, pretende-se examinar a possível otimização do processo de construção de tal vocabulário a partir do uso de tais estruturas.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Integrante / Zenilton Kleber G do Patrocinio Jr - Coordenador., Financiador(es): Fundação de Amparo à Pesquisa do Estado de Minas Gerais - Auxílio
financeiro.
-
2014 - 2017
Projeto de Cooperação Internacional Edital CAPES/PVE 09/2014 (Segmentação hierárquica de imagem e vídeo baseado em análise de grafos), Descrição: A segmentação hierárquica de vídeos produz um espaço-escala orientado à região, i.e., um conjunto d segmentações em diferentes níveis de detalhe no qual as segmentações com detalhes mais finos são incluídas nas de níveis mais grossos. Aplicações como a rotulação de cenas (ou regiões), assim como, o reconhecimento de ações podem basear-se nas informações destes diferentes níveis com o intuito de melhorar a qualidade do reconhecimento, além de facilitar sua rotulação, em contraponto ao uso da informação extraída em somente uma escala. Muitos algoritmos de segmentação de vídeos, tais como algoritmos de junção de regiões, baseiam-se em um critério de junção que não produz uma hierarquia, e pode necessitar de uma parametrização difícil.
O objetivo deste estudo é investigar formas de transformar algoritmos clássicos de segmentação em algoritmos hierárquicos, em particular sem exigência de refinamento de parâmetro, considerando tanto métodos interativos quantos não interativos. Espera-se ainda investigar estratétias para visualizar hierarquias tanto em imagens quanto em vídeos, como os mapas de saliência. Finalmente, estudar critérios de comparação entre hierarquias.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) / Doutorado: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Arnaldo de Albuquerque Araújo - Integrante / Jean Cousty - Integrante / Zenilton Patrocínio Jr. - Integrante / Jefersson Alex dos Santos - Integrante., Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Auxílio
financeiro.
-
2014 - 2017
Mineração Não-supervisionada de Conteúdo Multimídia - MAXIMUM, Descrição: Projeto de cooperação internacional entre DCC/UFMG, PUC-Minas, IC/UNICAMP,
INRIA/IRISA Rennes, UPMC Paris 6, Universidad de Chile e ORAND Chile. A
mineração não-supervisionada de conteúdo multimídia tem por objetivo a
detecção de padrões em dados multimídia compreendendo vídeo e voz, área
esta que apesar das inúmeras aplicações não tem despertado o devido
interesse da comunidade científica. O projeto MAXIMUM visa, assim, o
estudo, definição e avaliação de abordagens voltadas para a identificação
de padrões em sequências de dados de multimídia, envolvendo tanto aspectos
fundamentais quanto aplicados. Serão abordadas tecnologias comuns à
análise de conteúdo multimídia, indexação, gerenciamento de bancos de
dados e bioinformática na definição de uma abordagem escalável de detecção
de padrões e indexação de sequências temporais em estruturas multimídias.
Mais especificamente, serão investigadas técnicas de indexação para
sequências temporais em espaços de alta dimensionalidade, assim como
representações simbólicas de conteúdo multimídia, o que constituem duas
técnicas essenciais para uma detecção eficiente de padrões. Com base neste
trabalho, serão analisadas arquiteturas algorítmicas escaláveis e
eficientes que levem em conta aspectos tais como a variabilidade dos
referidos padrões. Os resultados poderão ser demonstrados e avaliados de
diferentes formas, indo da extração eficiente de conteúdos de sequências
multimídias à análise da tolerância a variações dos padrões detectados de
forma não-supervisionada e que se repetem numa dada sequência. O projeto
unirá esforços de laboratórios brasileiros, chilenos e franceses, todos
com larga experiência em análise de conteúdo multimídia, indexação e
mineração de dados. Este trabalho reforçará as colaborações existentes
entre os diversos parceiros e contribuirá para uma maior liderança das
instituições envolvidas, nesta área de pesquisa ainda emergente. O Projeto
é gerenciado pela CAPES, no Brasil, pelo CNRS, na França, e pelo CONICYT,
no Chile. Os coordenadores do Projeto são os Profs. Arnaldo de
Albuquerque, UFMG, Silvio Jamil Guimarães, PUC-Minas, Guillaume Gravier,
CNRS-IRISA, e Benjamin Bustos, Universidad de Chile.
Vigência: Jan 2014 a Dez 2015
Valor do auxílio CAPES: 08 tíquetes aéreos (BR-FR, ou BR-Chile), 60
diárias para pesquisadores estrangeiros, 04 missões de estudo de longa
duração (doutorado-sanduíche e/ou pós-doutorado).. , Situação: Concluído; Natureza: Pesquisa. , Integrantes: Silvio Jamil Ferzoli Guimarães - Integrante / Neucimar Jerônimo Leite - Integrante / Arnaldo de Albuquerque Araújo - Coordenador / Eduardo Alves do Valle Jr - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Ricardo Torres - Integrante / Matthieu Cord - Integrante / Patrick Gros - Integrante / Guillaume Gravier - Integrante / Laurent Amsaleg - Integrante / Benjamin Bustos - Integrante.
-
2014 - 2017
Unsupervised motif discovery in multimedia content (MOTIF), Descrição: EDITAL 12/2013 - COOPERAÇÃO INTERNACIONAL FAPEMIG-INRIA-CNRS?: Unsupervised multimedia content mining aims at discovering in an unsupervised manner repeating motifs within multimedia data such as video or speech, an emerging field which as received limited attention so far in spite of numerous potential applications. This project aims at studying various approaches to unsupervised motif discovery in multimedia sequences, i.e., to the discovery of repeated sequences with no prior knowledge on the sequences. In this context, we will develop work along two main research directions. On the one hand, we will develop symbolic approaches inspired from work on bioinformatics to motif discovery in the multimedia context, investigating symbolic representations of multimedia data and adaptation of existing symbolic motif discovery algorithms. On the other hand, we will further develop cross modal clustering approaches to repeated sequence discovery in video data, building upon previous work. We will investigate new cross clustering approaches incorporating constraints on clusters and propose new selection criteria. \motif\ will develop fundamental technology at the frontier of multimedia content analysis, multimedia indexing and bioinformatics technology, with practical applications in media content structuring. We will build upon existing research and skills at INRIA, PUC Minas and UFMG to develop collaborative work exploiting complementarity of these institutions.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (4) / Mestrado acadêmico: (2) / Doutorado: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Arnaldo de Albuquerque Araújo - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Patrick Gros - Integrante / Guillaume Gravier - Integrante / Laurent Amsaleg - Integrante / William Robson Schwartz - Integrante / Jefersson Alex dos Santos - Integrante / Philippe H Gosselin - Integrante., Financiador(es): Centre de recherche Inria Rennes - Bretagne Atlantique - Cooperação / Fundação de Amparo à Pesquisa do Estado de Minas Gerais - Cooperação.
-
2014 - 2017
SmartView: Monitoramento Automático Aplicado a Grandes Competições Esportivas, Descrição: Devido ao grande número de pessoas presentes em instalações esportivas que sediam competições com grandes públicos, como estádios ou ginásios, há vários problemas difíceis de serem tratados de uma forma eficiente quando todo o processo de análise é efetuado de forma manual, tais como a detecção de conflitos ocorrendo nas arquibancadas e a identificação e localização dos indivíduos envolvidos ou a delimitação de regiões das arquibancadas ou grupo de indivíduos que devem ser monitorados com maior atenção devidos aos seus comportamentos indevidos. Com intuito de auxiliar no monitoramento e, consequentemente, na segurança dos torcedores presentes em competições esportivas, este projeto visa empregar técnicas de visão computacional para automatizar a resolução dos problemas acima no sentido de proporcionar informações relevantes aos responsáveis pelo monitoramento dos torcedores em instalações esportivas objetivando o aumento da precisão e eficiência na tomada de decisões. Desta maneira, os agentes de segurança receberão apenas segmentos de vídeos contendo situações classificadas como de interesse do ponto de vista do monitoramento de ambientes e vigilância, as quais podem requerer algum tipo de intervenção humana. Para que seja possível obter as informações necessárias para a execução satisfatória do sistema de monitoramento, o projeto focará tanto na obtenção de soluções robustas por meio da utilização de descritores de características visuais acurados de modo a reduzir a propagação de erros nos problemas de detecção, reconhecimento e reidentificação de pessoas e no reconhecimento de suas ações, quanto no desenvolvimento de metodologias eficientes que possibilitarão o processamento de grandes quantidades de dados visuais.. , Situação: Concluído; Natureza: Pesquisa. , Integrantes: Silvio Jamil Ferzoli Guimarães - Integrante / Arnaldo de Albuquerque Araújo - Integrante / GUILLERMO CAMARA CHAVEZ - Integrante / William Robson Schwartz - Coordenador / Bruno Pena Couto - Integrante / David Menotti - Integrante / Jefersson Alex dos Santos - Integrante., Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio
financeiro.
-
2013 - 2013
Missão de trabalho - PROJETO CAPES/BRAFITEC 138/2013 - 10 dias, Descrição: Desenvolvimento de atividades em que a participação de alunos de graduação é fundamental, dentre os temas de pesquisas envolvidos neste projeto, podemos citar: (i) aplicação de algoritmos eficientes na busca de videoclipes em grandes bases de dados; (ii) aplicação de algoritmos eficientes para a identificação de imagens similarires em grandes bases de dados distribuídas; (iii) inserção de métodos de busca baseado em conteúdo visual em redes sociais (MARITACA).. , Situação: Concluído; Natureza: Pesquisa. , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Dário Vieira da Conceição - Integrante.
-
2012 - 2016
FORmação em Tecnologia da Informação e da Comunicação, Descrição: O presente projeto apresenta a cooperação entre a PUC Minas e a Efrei, por meio de intercâmbio de alunos e professores dos seus cursos de Engenharia de Computação e Ingénieur en Informatique , respectivamente. Doravante, ambos os cursos serão chamados de Engenharia de Computação.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (29) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Lucila Ishitani - Integrante / Henrique Cota de Freitas - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Dário Vieira da Conceição - Integrante / Romanelli Londron Zuim - Integrante., Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Auxílio
financeiro.
-
2012 - 2015
Projeto de Pesquisa Edital MCT/CNPq 14/2012 - Universal, Projeto certificado pelo(a) coordenador(a) Arnaldo de Albuquerque Araújo em 20/03/2013., Descrição: "Recuperação de Informação em Grandes Bases de Dados de Imagens e Vídeos - FINDPIX V Edital MCT/CNPq 14/2012 - Universal Proc. 476204/2012-7 Faixa B. Vigência: Dez 2012 a Nov 2015 Valor do auxílio: R$ 59.450,00 + 01 Bolsa IC 36 meses + 01 Bolsa AT 36 meses O crescimento exponencial na criação e acúmulo de dados não escapou ao vídeo digital. A maioria da produção profissional de vídeo já se faz em formato digital, o que implica a necessidade de gerir, preservar e prover acesso a um volume de dados que desafia o estado da arte tecnológico. Além dessa produção profissional, a democratização dos equipamentos de gravação, bem como o surgimento de redes sociais que estimulam o registro e o compartilhamento de produções pessoais, vem revolucionando a relação do público com essa mídia e gerando uma demanda por ferramentas de recuperação de informação especializadas e por mecanismos que permitam coibir abusos e infrações. É nesse contexto que este projeto se insere. Propomos avançar o estado da arte em classificação e recuperação semântica de vídeos, associando extração automática de descritores espaço-temporais altamente discriminantes e técnicas avançadas de Aprendizagem de Máquina capazes de prover a generalização necessária para a busca de categorias complexas. Para tanto, tencionamos explorar cinco linhas de pesquisa, correspondentes a cinco contextos aplicativos arrojados: o reconhecimento de ações humanas em vídeos, classificação estilística de fachadas em cidades históricas, a detecção de objetos em vídeos a partir de rascunhos, segmentação multimodal de vídeos e representação da informação visual para classificação de conceitos semânticos. Por fim, todas essas contribuições serão agrupadas em uma interface de desenvolvimento visual que possibilitará a atuação dessas técnicas em conjunto. Visamos a formação humana a níveis de doutorado, mestrado e graduação; a geração de publicações em eventos e periódicos de qualidade; e a transferência de tecnologia... , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) / Doutorado: (8) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Integrante / Arnaldo de Albuquerque Araújo - Coordenador / Eduardo Alves do Valle Jr - Integrante / Kleber Jacques F. de Souza - Integrante / HENRIQUE BATISTA DA SILVA - Integrante., Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio
financeiro.
-
2011 - 2013
Análise e resumo de vídeo usando informação multimodal (TVSum), Descrição: O projeto TVSum tem por objetivo o intercâmbio científico-tecnológico em dois temas em que as equipes brasileiras e francesas são complementares: criação de resumo de vídeo e localização vídeo clipe. A equipe brasileira tem trabalhado nestes temas considerando apenas a informação visual. Como a equipe francesa é especialista em processamento e análise de informação multimodal, propõe-se neste projeto a criação do resumo de vídeo e a localização de vídeo usando informação multimodal de forma a tornar o processo mais eficiente e eficaz.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (4) / Especialização: (0) / Mestrado acadêmico: (2) / Mestrado profissional: (0) / Doutorado: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Arnaldo de Albuquerque Araújo - Integrante / Hugo Bastos de Paula - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / GUILLERMO CAMARA CHAVEZ - Integrante / Patrick Gros - Integrante / Patrice Sébillot - Integrante., Financiador(es): Institut National de Recherche en Informatique et en Automatique - Siège - Auxílio
financeiro / Fundação de Amparo à Pesquisa do Estado de Minas Gerais - Auxílio
financeiro.
-
2011 - 2013
Desenvolvimento De Artefatos Reutilizáveis Para Plataformas De Computação Na Nuvem, Descrição: Desenvolvimento De Artefatos Reutilizáveis Para Plataformas De Computação Na Nuvem. , Situação: Em andamento; Natureza: Pesquisa. , Integrantes: Silvio Jamil Ferzoli Guimarães - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Maria Augusta Vieira Nelson - Coordenador / Humberto Maques Torres - Integrante.
-
2011 - Atual
Uso de algoritmos de grafos para análise e processamento de imagem e vídeo, Descrição: Por meio da redução de problemas de imagem e vídeo para problemas de grafos, pretende-se estudar mapeamentos entre estes problemas, como localização de vídeo, particionamento de vídeo, resumo de vídeo, simplificação de imagens coloridas.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Especialização: (1) / Mestrado acadêmico: (4) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / DO PATROCÍNIO, ZENILTON KLEBER GONÇALVES - Integrante.
-
2010 - 2010
Visita técnica PPM CEX 126, Descrição: Visita técnica a ESIEE (França) para discussões de projetos de pesquisa envolvendo Processamento de Imagem e Vídeo com os professores Michel Couprie, Jean Cousty, Dror Aiger, assim como visita a EFREI (Fatiha Gas e Dario Vieira). , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (2) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Michel Couprie - Integrante / Jean Cousty - Integrante / Dror Aiger - Integrante., Financiador(es): Fundação de Amparo à Pesquisa do Estado de Minas Gerais - Auxílio
financeiro.
-
2008 - 2011
Análise Interativa e Baseada no Conteúdo de Dados Multimídia para Aplicações em Vídeo Digital, Descrição: Abordar o problema de segmentação de vídeo, extração de informação e sua representação semântica por aprendizado. Neste sentido, propõe-se um framework associando as duas abordagens ? descritores visuais eficientes e métodos estatísticos de aprendizagem ? na definição de um sistema eficiente de representação semântica do conteúdo de um vídeo.. , Situação: Em andamento; Natureza: Pesquisa. , Integrantes: Silvio Jamil Ferzoli Guimarães - Integrante / Neucimar Jerônimo Leite - Integrante / Arnaldo de Albuquerque Araújo - Coordenador / Michel Couprie - Integrante / Ricardo Torres - Integrante / Matthieu Cord - Integrante / Sylvie Phliippe - Integrante., Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Cooperação / COFECUB - Cooperação.
-
2008 - 2010
Estratégias e Infra-estrutura para o Desenvolvimento de Objetos de Aprendizagem Reutilizáveis na Web 2.0, Descrição: Objetivo do projeto é definir estratégias e infra-estrutura para o desenvolvimento de objetos de aprendizagem com o intuito de promover a reutilização dos mesmos, recomendando diretivas, ferramentas de apoio e métricas para avaliação da reutilização... , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Integrante / Lucila Ishitani - Integrante / Maria Augusta Vieira Nelson - Coordenador., Financiador(es): Fundação de Amparo à Pesquisa do Estado de Minas Gerais - Auxílio
financeiro.Número de orientações: 1
-
2008 - 2010
Uma Arquitetura de Recuperação de Informação para Análise e Extração de Informação Indexável em Recursos Audiovisuais, Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (1) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Hugo Bastos de Paula - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante., Financiador(es): Fundação de Amparo à Pesquisa do Estado de Minas Gerais - Auxílio
financeiro., Número de produções C, T & A: 7
-
2008 - 2009
Missão de Trabalho Convênio CAPES/COFECUB 592/08, Descrição: Diversos temas, relacionados a este projeto, podem ser considerados interessantes no estágio pós-doutoral, dentre eles: (i) aplicação de ferramentas de aprendizado na sumarização de vídeo; (ii) aplicação de algoritmos eficientes na busca de videoclipes em grandes bases de dados; (iii) estudo de estrutura de dados eficientes na indexação de imagens e vídeo, de forma a facilitar sua busca; (iv) estudo de características salientes a serem usadas no processo de recuperação de imagens e vídeo. Acredita-se que estes temas possam representar o início da discussão sobre este estágio.. , Situação: Concluído; Natureza: Pesquisa. , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Michel Couprie - Integrante / Matthieu Cord - Integrante., Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Auxílio
financeiro.
-
2008 - Atual
Microsoft Innovation Center BH, Descrição: Desenvolver projeto de pesquisa e desenvolvimento em TIC usando plataforma Microsoft. O MIC-BH tem por objetivo ainda realizar treinamentos em TIC.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (6) / Especialização: (0) / Mestrado acadêmico: (4) / Mestrado profissional: (0) / Doutorado: (0) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Lucila Ishitani - Integrante / Luis Enrique Zárate Galvez - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Sandro Jerônimo - Integrante., Financiador(es): Belo Horizonte Sistemas Ltda - Bolsa / Microsoft Informática - Bolsa., Número de produções C, T & A: 2 / Número de orientações: 2
-
2007 - 2009
Uma Arquitetura de Recuperação de Informação para Análise e Extração de Informação Indexável em Recursos Audiovisuais, Descrição: A utilização cada vez maior de recursos visuais em salas de aula, apresentações de trabalhos em conferências, e defesas de dissertações e teses, tem proporcionado um aumento na demanda de sistemas computacionais eficientes e eficazes capazes de lidar com esse tipo de informação. Neste projeto, serão considerados problemas advindos da captura de dados, em que poderão ser usados tanto equipamentos de filmagem, quanto sistemas de ``digitalização'' automática de documentos eletrônicos, problemas advindos da visualização de grandes massas de dados, problemas advindos da indexação de grandes massas de dados. Serão considerados também abordagens para consultas ao material lecionado, localização de uma determinadas aula em que foi ensinado determinado assunto ou consulta ao conteúdo de uma defesa, além da possibilidade de se utilizar dispositivos móveis para a realização destas consultas.. , Situação: Em andamento; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Hugo Bastos de Paula - Integrante / Zenilton Kleber G do Patrocinio Jr - Integrante / Theldo Cruz Franqueira - Integrante., Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio
financeiro., Número de produções C, T & A: 7
-
2005 - 2007
Uso do ritmo visual para a identificação de eventos em vídeo, Descrição: A abordagem clássica para resolver o problema de particionamento, que é a primeira etapa na análise de vídeo, é baseada no cálculo de medidas de dissimilaridade entre quadros. Este problema de segmentação em vídeo pode ser transformado em um problema de detecção de padrões, onde cada evento de vídeo é transformado em diferentes padrões em uma imagem espaço-temporal 2D, chamada ritmo visual. Para tratar este problema, serão consideradas basicamente ferramentas morfológicas e topológicas com o objetivo de identificar os padrões específicos que são relacionados a eventos do vídeo, como cortes, fades, dissolves e flash.
Para a simplificação do vídeo, estudaremos o Grafo de Transição de Cenas e a Tabela de Conteúdo. Para a identificação e eliminação de redundâncias, estudaremos medidas de similaridades entre seqüências, que baseiam-se na transformação do conteúdo do vídeo em informação textual seguida por algoritmos de casamento de padrão. Entretanto, todas estas abordagens consideram o vídeo com uma entidade 2D + t. Neste trabalho, transformaremos o vídeo, 2D + t, para uma imagem, 1D + t, e a partir desta imagem proporemos novas ferramentas para particionar, resumir e eliminar redundâncias.Assim, o projeto AVIdE, que está sendo proposto, tem por objetivo particionar, resumir e eliminar redundâncias em vídeos a partir da análise do ritmo visual.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (4) / Especialização: (0) / Mestrado acadêmico: (2) / Mestrado profissional: (0) / Doutorado: (0) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Hugo Bastos de Paula - Integrante., Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio
financeiro.
-
2005 - 2005
Estudo e Implementação Multimídia para Aplicações Didático-Pedagógicas, Descrição: Na relação ensino-aprendizagem os recursos visuais vêm se mostrando cada vez mais eficientes.
A utilização de informações de multimídia mostra-se cada vez mais importante no apoio ao ensino, uma vez que o ser humano consegue assimilar mais facilmente a informação transmitida por uma imagem do que somente por um texto dissertativo. Por meio de informação visual, usando exemplos aplicados, o objetivo é o de reforçar os conceitos teóricos apresentados. Tais recursos permitem ao aluno uma interação maior, com uma visão prática dentro do contexto conceitual abordado, onde poderá trabalhar de forma criativa e participativa das aulas.
A grande relevância deste projeto de pesquisa, além de ser um trabalho inovador, é o de buscar meios de aprimorar a relação ensino-aprendizagem, oferecendo um facilitador ao aluno para o entendimento de conceitos clássicos, que apresentam um certo grau de dificuldade, já comprovado na prática em aulas presenciais. A proposta é a de estudar e implementar uma ferramenta de multimídia que sirva como apoio didático-pedagógico em aulas presenciais e semi-presenciais.. , Situação: Concluído; Natureza: Pesquisa. , Alunos envolvidos: Graduação: (2) / Especialização: (0) / Mestrado acadêmico: (0) / Mestrado profissional: (0) / Doutorado: (0) . , Integrantes: Silvio Jamil Ferzoli Guimarães - Coordenador / Lucila Ishitani - Integrante / Rosely Maria Velloso Campos - Integrante., Financiador(es): Pontifícia Universidade Católica de Minas Gerais - Auxílio
financeiro.Número de orientações: 2