Uno dei metodi utilizzati dagli spammer per creare liste di indirizzi da bersagliare è il cosiddetto e-mail harvesting, ovvero la raccolta indifferenziata e massiccia di indirizzi e-mail da Internet. Di solito questo avviene per mezzo di alcuni software che scaricano migliaia e migliaia di pagine web, seguendo i link come farebbe lo spider di un motore di ricerca. Il codice HTML delle pagine viene così passato al setaccio alla ricerca di indirizzi e-mail da inserire in un elenco che andrà a ingrossare le liste di spamming.
Contro l'e-mail harvesting gli utenti più avveduti e alcuni provider implementano una serie di contromisure, una di queste è il mascheramento dell'indirizzo e-mail nel codice HTML della pagina.
Di solito il codice contiene l'indirizzo e-mail così come viene mostrato sul web. È però possibile sostituirlo con una serie di codici corrispondenti alle lettere dell'alfabeto, alle cifre e ai caratteri speciali (chiocciola, underscore, ecc) contenuti nell'indirizzo. La pagina web mostrerà sempre l'indirizzo come se niente fosse, ma il codice HTML sarà profondamente modificato.
Visto che un test vale più di mille parole, andate su questo sito e provate a inserire un indirizzo e-mail (anche inventato, se non vi fidate). Fate click su Encode e otterrete la stringa HTML da inserire all'interno della vostra pagina web. Quel confuso insieme di caratteri, una volta inserito nel codice delle vostre pagine, da una parte mostrerà l'indirizzo e-mail come se niente fosse, ma dall'altra ingannerà una bella fetta di software di email harvesting: la stragrande maggioranza di essi infatti non riconoscerà alcun indirizzo e-mail nel codice HTML e andrà avanti per la sua strada.
Questo ovviamente non significa che in futuro non vi sarà software in grado di scoprire gli indirizzi mascherati (visto che - come dimostra questo documento - non è difficile creare uno script che vada a decodificare gli indirizzi nascosti), ma oggi con questo metodo siamo ancora in grado di imbrogliare una buona percentuale di harvester.
Per essere veramente sicuri si possono implementare altri accorgimenti, come la sostituzione della chiocciola con un'analoga immagine grafica, oppure con l'inserimento di spazi prima e dopo la chiocciola (ma in entrambi i casi il "mailto:" non funzionerà, quindi chiunque voglia invarvi un messaggio dovrà riscrivere il vostro indirizzo a mano). Qui ne vengono illustrati altri.


