terça-feira, 27 de fevereiro de 2007

9° Nível - Lógica Bayesiana

Em agosto de 2002 Paul Graham, um famoso programador e empresário do setor tecnológico norte-americano, escreveu um artigo que mudaria alguns conceitos sobre o combate ao spam. Sustentando que spam é um problema de lógica probabilística ele incitou muitos desenvolvedores com seu conceito relativamente simplista de encarar o problema - para ele dois grandes bancos de dados de palavras encontradas em mensagens idôneas e em mensagens spams poderiam ser utilizados para testar toda nova mensagem, e assim classificá-la como boa ou má... a idéia foi legal, o cara tinha razão, mas só este approach poderia trazer muitos falsos positivos e falsos negativos.

E ainda assim, para que isto realmente funcionasse o usuário teria de receber muitas mensagens e treinar constantemente o programa, seria, pelo menos no começo, um trabalhão. Mas ficamos antenados com a idéia, sempre nos pareceu maluco testar uma mensagem com um algoritmo matemático, mas fazia sentido a lógica.

O SafestMail nasceu como um bloqueador de spam por permissões de acesso, ou seja, ninguém entra a não ser que o usuário permita. Implementamos 8 níveis de permissões, e muitas mensagens acabavam parando na quarentena. Queríamos mais - que o sistema fosse realmente inteligente e que descobrisse se tais mensagens poderiam ser idôneas ou spams. Testamos exaustivamente a lógica bayesiana e descobrimos que como 9° nível funciona muito bem. Além do mais todo o trabalho do treinamento pegaria carona com as habilitações e bloqueios gerados pelas permissões de acesso.

Hoje o Safo - SafestMail for Outlook/Outlook Express é o único anti-spam do mundo que conta com 9 níveis de proteção, utilizando-se de permissões de acesso aliado a lógica bayesiana.

0 comentários: