Método de filtragem automática de spams

  • Número do pedido da patente:
  • PI 1004892-8 A2
  • Data do depósito:
  • 30/11/2010
  • Data da publicação:
  • 19/03/2013
Inventores:
  • Classificação:
  • G06N 7/00
    Sistemas de computador baseados em espec?ficos modelos matem?ticos;
    ;
    G06N 99/00
    Mat?ria n?o abrangida pelos demais grupos desta subclasse;
    ;

Método de filtragem automática de spams. Nos últimos anos, spams têm se tornado um importante problema com enorme impacto na sociedade. A filtragem automática de tais mensagens impõe um desafio especial em categorização de textos, no qual a característica mais marcante é que os filtros enfrentam um adversário ativo, que constantemente procura evadir as técnicas de filtragem. O objeto da presente invenção trata-se de um método de filtragem automática de spam baseado no princípio da descrição mais simples auxiliado por fatores de confidência. O método MDL-CF possui várias caracteristicas apropriadas: consome poucos recursos computacionais, é fácil de ser implementado, muito rápido na classificação de novas mensagens e seu treinamento e aprendizado são muito simples. É bastante eficaz e eficiente na tarefa de classificação de spams, superando os resultados obtidos por métodos consagrados e por outros filtros previamente publicados na literatura. Outro ponto interessante é que o método proposto pode ser estendido e aplicado na solução de problemas de diversas áreas que envolvam classificação e categorização de textos, tais como: web spamming, blog spamming, social network spamming, mobile spamming, além de qualquer outro tipo de spam disseminado por texto.