Método de filtragem automática de spams

Número do pedido da patente:
PI 1004892-8 A2

Data do depósito:
30/11/2010

Data da publicação:
19/03/2013

Inventores:

Tiago Agostinho de Almeida

Akebo Yamakami

Classificação:
G06N 7/00

Sistemas de computador baseados em espec?ficos modelos matem?ticos;

;
G06N 99/00

Mat?ria n?o abrangida pelos demais grupos desta subclasse;

;

Nome do depositante:
Universidade Estadual de Campinas - Unicamp

Nome do procurador:
Fernanda Lavras Costallat Silvado

Método de filtragem automática de spams. Nos últimos anos, spams têm se tornado um importante problema com enorme impacto na sociedade. A filtragem automática de tais mensagens impõe um desafio especial em categorização de textos, no qual a característica mais marcante é que os filtros enfrentam um adversário ativo, que constantemente procura evadir as técnicas de filtragem. O objeto da presente invenção trata-se de um método de filtragem automática de spam baseado no princípio da descrição mais simples auxiliado por fatores de confidência. O método MDL-CF possui várias caracteristicas apropriadas: consome poucos recursos computacionais, é fácil de ser implementado, muito rápido na classificação de novas mensagens e seu treinamento e aprendizado são muito simples. É bastante eficaz e eficiente na tarefa de classificação de spams, superando os resultados obtidos por métodos consagrados e por outros filtros previamente publicados na literatura. Outro ponto interessante é que o método proposto pode ser estendido e aplicado na solução de problemas de diversas áreas que envolvam classificação e categorização de textos, tais como: web spamming, blog spamming, social network spamming, mobile spamming, além de qualquer outro tipo de spam disseminado por texto.