4. Estatísticas

Este trabalho não pretende dar muito foco em estatísticas sobre o envio de spam, visto que estes dados são sempre imprecisos, desatualizados e de baixa confiança. As próximas seções deste tópico estão presentes apenas em nível de comentário.

4.1. Dados Gerais

Não existem estatísticas globais sobre o envio de spam, entretanto é possível analisar algumas amostragens em grandes servidores relacionados ao assunto. Dois respeitáveis serviços que possuem um gráfico estatístico são o spamcop.net e o Distributed Checksum Clearinghouses.

O primeiro, spamcop.net, é um famoso serviço anti-spam, que pode ser contratado por empresas e pessoas físicas sob um certo custo. O serviço disponibiliza um endereço de email @spamcop.net ou permite manter seu próprio endereço, agindo apenas como filtro intermediário. O spamcop.net possui uma grande lista negra, gerada através de relatórios de usuários. Ver mais em [7. Técnicas anti-spam] e [9]

Estatísticas do número de spams recebidos pelos servidores spamcop durante o mês de maio de 2009
Figura 1: Estatísticas do número de spams recebidos pelos servidores spamcop durante o mês de maio de 2009

O segundo serviço, o Distributed Checksum Clearinghouses, é um filtro anti-spam multi-plataforma, que em meados de 2007 já possuía cerca de 600 mil computadores clientes e hoje conta com 300 servidores para armazenar os checksums de emails relatados como spam. Ver mais em [7. Técnicas anti-spam] e [10]

Estatísticas do número de spams recebidos pelos servidores DCC entre Junho de 2008 e Maio de 2009
Figura 2: Estatísticas do número de spams recebidos pelos servidores DCC entre Junho de 2008 e Maio de 2009. O gráfico exibe apenas transações, e não endereços: uma mensagem enviada a 1 ou 1000 pessoas é contada como apenas 1.

4.2. Crescimento do spam

Em Outubro de 2007, um interessante tópico [11] foi publicado no Blog Oficial do Gmail, comentando sobre o funcionamento e algumas estatísticas de seu filtro de email. O gráfico presente no tópico mostra um crescimento no percentual de emails que são categorizados como spam, passando por 30% em abril de 2005 e chegando a quase 80% de todos os emails recebidos pelo domínio gmail.com, entre Dezembro de 2006 e Julho de 2007.

4.3. Custos

Os custos (nem todos apenas monetários) do spam estão distribuídos em:

  • Perda de produtividade
    • Estima-se que um funcionário perde de 5 a 10 segundos para reconhecer, selecionar e apagar um spam, o que pode ser facilmente transformado em 10 a 15 minutos diários
    • Spams que afetam sistemas de busca e newsgroups podem dificultar a localização de informações úteis
    • Sistemas de proteção contra spam (como por exemplo os CAPTCHAS) atrasam fluxos contínuos de trabalho. Ver mais em [7. Técnicas anti-spam]
  • Banda e armazenamento
    • Embora emails tenham uma pequena parcela no consumo de banda, sua frequência é grande e spams já representam cerca de 80% dos emails enviados
    • Spams worms que podem congestionar o tráfego em uma rede. Ver mais em [3.5. Programas maliciosos]
  • Gastos com serviços anti-spam
  • Fraudes e roubos
    • Custos com manutenção para remoção de vírus
  • Psicológicos
    • Spams com conteúdo inapropriado e ofensivo
  • Culturais
    • Muitos hoaxes (boatos) podem ser facilmente considerados verdadeiros por parte da população, e com uma velocidade de disseminação muito grande.Ver mais em [3.1. Boatos (hoaxes)]
  • Mal-entendimentos
    • Emails com conteúdo pornográfico podem causar divórcios e demissões

4.4. Origem geográfica

As estatísticas sobre a origem geográfica do spam referem-se ao lugar onde está localizado o servidor de emails usado, que não necessariamente fica perto, nem mesmo no mesmo país do spammer. A globalização do spam mostra ainda que é muito comum possuir servidor, spammer e vítima, todos em países ou continentes diferentes.

O site spamshield.org disponibiliza uma interessante visão da origem dos spams, usando a ferramenta Google Maps, eles exibem a concentração e origem dos spams detectados nas últimas 24 horas, atualizando estes dados a cada 60 minutos.

Distribuição geográfica do envio de spam detectado pelo site spamshield.org no dia 29/05/2009
Figura 3: Distribuição geográfica do envio de spam detectado pelo site spamshield.org no dia 29/05/2009