MAC499 - Trabalho de Formatura Supervisionado

Estudo de máquinas de suporte vetorial e sua aplicação na detecção de spam


Aluno: Antonio Carlos dos Santos (acsantos at linux.ime.usp.br)
Supervisor: Paulo José de Silva e Silva (pjssilva at ime.usp.br)
Tipo de Trabalho: Iniciação Científica

  • Proposta     [html]

  • Pôster     [pdf]

  • Apresentação     [pdf]

  • Monografia     [pdf]

Introdução

Com o uso cada vez maior da Internet, a troca de mensagens eletrônicas, os e-mails, tornou-se uma ação muito frequente entre seus usuários, tanto para discutir assuntos profissionais quanto pessoais. Entretanto, o número de mensagens indesejadas recebidas, os spams (Stupid Pointless Annoying Messages), também é muito grande. Esta situação tem gerado vários problemas, tanto para empresas provedoras de acesso à Internet, que têm uma carga maior de uso de seus servidores, quanto para os usuários, que gastam tempo lendo spams para depois descartá-los, e podem ainda serem prejudicados por programas maliciosos, como vírus e spywares.

Assim, para evitar tais problemas, atualmente tem-se pesquisado bastante novas formas de detectar e bloquear mensagens consideradas spams automaticamente. Entre elas, está o uso de máquinas de suporte vetorial, em inglês Support Vector Machines (SVM). Elas são um novo conceito na área de sistemas de aprendizado computacional, baseadas na teoria de aprendizado estatístico, desenvolvida principalmente por Vladimir Vapnik, e têm apresentado bom desempenho em várias aplicações, como, por exemplo, classificação de sequências de DNA e reconhecimento de imagens.


Última modificação: Sáb Dez 3 18:42:49 EDT 2005

(O layout desta página foi baseado no da página da aluna Ellen H. Fukuda.)