it-swarm-eu.dev

Qual è il punto dello spam senza senso

Mi capita spesso di imbattersi in forum spammati con messaggi come:

La rucola (Eruca sativa) è una pianta verde trimestrale, finta o roquette. Sono stati i tempi tradizionali, l'overclever 20 flat è stato utile per il movimento dei "buongustai". Prima dell'impedimento degli anni '90, il brivido era una norma raccolta selvaggiamente straniera. Il colore ha naturalizzato il mondo reazionario, in cima a tutto ciò che è stato aggiunto in Europa, oltre al Nord America. La rucola è tutta la regione del Mediterraneo, lontano dal Marocco e dal Portogallo, dal Libano orientale e dalla Turchia. All'incirca in India, i semi adulti sono Gargeer senza figli. Il solvente è una famiglia di scour (Brassicaceae), l'asta è un razzo piuttosto distante, che è pubblico ...

Qual è lo scopo dietro tale spam? È fastidioso, sì, ma si presume che lo spammer abbia uno scopo diverso da quello di semplicemente infastidire lo sforzo di farlo. Non vedo alcun URL o hot link nel messaggio e nessuna apparente formattazione "divertente" che potrebbe sfruttare qualcosa.

Sta in qualche modo cercando di influenzare i web crawler? (E, in tal caso, a quale scopo?) In qualche modo sfrutta una sorta di debolezza nel software del forum? Che cosa?

Aggiunto: Non proprio correlato alla domanda originale - più di un commento tangenziale, ma ho pensato che valesse la pena tenerlo nello stesso posto, nel caso in cui qualcuno venga a cercare:

La natura dei "strani" post sul forum a cui sto pensando principalmente ( http://forums.finehomebuilding.com/ ) è sostanzialmente cambiata. Ciò che otteniamo ora (una/due volte a settimana) sono post che pappaglino i dettagli dei post precedenti nella discussione (spesso una discussione molto vecchia), o forse i dettagli ottenuti da una ricerca web sull'argomento della discussione, ma sono generalmente inutili (a meglio una natura "anch'io") e l'inglese, sebbene tecnicamente corretto, è un pelo impilato e chiaramente non quello di un parlante inglese (né britannico, americano, indiano, né africano, tutti i cui dialetti sono almeno passivamente familiari con).

La mia ipotesi migliore è che queste sono persone, probabilmente in Cina, che stanno imparando l'inglese e stanno usando il forum come una sorta di test, per vedere se il loro post non viene rilevato. Non so, tuttavia, se questo è semplicemente un gioco, un test per una lezione di inglese o un test/pratica per un aspirante spammer. (È improbabile che stiano cercando di "favorire il curry" con il filtro antispam, in quanto la cosa ("Mollom") è notoriamente traballante e fa passare felicemente lo spam al primo tentativo mentre rifiuta i post legittimi.)

Ma aspetta - c'è di più !!

Per circa l'anno scorso il forum di cui parlo è stato regolarmente (almeno settimanalmente e talvolta più volte al giorno - due volte finora questa mattina) bombardato da post come:

Unità da cucina in vendita. Trenta ex cucine con display da cancellare. www. e x d i s p l a y k i t c h e n s 1 .it £ 595 Ciascuno con elettrodomestici.

(URL leggermente corrotto per non incoraggiare queste persone.)

Apparentemente si tratta di uno spammer importante che opera al di fuori dell'Europa (e il nostro forum è orientato verso gli Stati Uniti per circa il 99%), quindi è inutile al massimo. La cosa più strana è che il costante spamming ha apparentemente "avvelenato" l'URL di Google (e probabilmente altri motori di ricerca) in modo tale che devi praticamente precisare l'URL per ottenere un "hit".

(L'altra cosa strana, ovviamente, è che gli operatori di sistema sembrano incapaci di bloccarlo, anche se l'URL è sempre lo stesso.)

Un'altra domanda -

Dal momento che, come ho osservato in precedenza, i post sullo "spam di cucina" (visti anche su dozzine di altri BB) hanno apparentemente "avvelenato" il sito web associato a Google, è possibile che lo spam stia effettivamente volendo fare questo, ed è istigato da qualcuno (un concorrente?) che desidera male per quel sito?

65
Hot Licks

Stanno cercando di fare un avvelenamento bayesiano.

Inviando molte parole corrette e alcune parole che vengono utilizzate nello spam, come il Viagra, queste parole ricevono una notifica di spam inferiore (nel tempo).

Ciò significa che dopo un po 'possono ricevere spam reale con collegamenti al filtro.

105
Lucas Kauffman

Le mie osservazioni sono che questo tipo di spam è stato il primo post di un utente appena creato. Dopo alcuni di questo tipo, si avvia il normale ordinamento con collegamenti inclusi.

Le mie ipotesi sullo scopo sono:

  1. Ingannare il software anti-spam che si concentra sui primi post.
  2. Rimuovere i primi dieci post in modo che possano pubblicare link. Alcuni software del forum lo applicano.
  3. Riempimento delle parole chiave dei motori di ricerca. Non vedo parole chiave ovvie nel tuo esempio ma ho nei forum che eseguo.
28
Ladadadada

(Dichiarazione di non responsabilità: sono nel settore antispam ma non rappresento ufficialmente il mio datore di lavoro.)

Esistono due tipi di spam in questa domanda.

I primi due esempi ("rucola" e "commenti pappagallo") sono avvelenamento bayesiano.

L'avvelenamento bayesiano è un tentativo di nascondere il contenuto di spam tra i contenuti di ham, che aspira a confondere i filtri antispam di machine learning. In realtà non funziona .

Il terzo esempio ("unità cucina") non ha nulla di fuori tema (ad es. Citazioni casuali come i primi due esempi) ed è piuttosto breve. L'avvelenamento da Bayes è definito dal suo contenuto off-topic o non-sequitur ed è quasi sempre abbastanza dettagliato, quindi questo non è avvelenamento da Bayes.

Unità da cucina in vendita. Trenta ex cucine con display da cancellare. www. e x d i s p l a y k i t c h e n s 1 .it £ 595 Ciascuno con elettrodomestici.

Questo è spam con racchette da neve, che prende il nome da scarpe giganti simili a cestini che distribuiscono il tuo peso attraverso la neve e quindi evitare di affondare nella neve ad ogni passo. Questo lascia un'impronta più leggera ed è quindi più difficile da tracciare. Lo spam con le racchette da neve aspira a camminare allo stesso modo leggermente ed essere più difficile da notare.

(URL leggermente corrotto per non incoraggiare queste persone.)

Questo avvertimento è in realtà importante. Le racchette da neve tendono a non offuscare molto i suoi collegamenti (poiché ciò rende meno probabile che le vittime facciano clic). Invece, il dominio viene utilizzato così brevemente che lo spam è già arrivato nella tua posta in arrivo quando RI DNSBLs può inserirli nella blacklist.

Lo spam con racchette da neve generalmente ha un corpo corto, vende qualcosa e finge di essere un marketer in qualche modo legittimo. L'attuale generazione di racchette da neve è limitata a oggetti moralmente puliti (come unità da cucina o tubi da giardino) piuttosto che oggetti moralmente discutibili (come porno o droghe), ma questo potrebbe facilmente cambiare.

Inizialmente, lo spam con racchette da neve aveva un volume molto basso al fine di eludere la notifica dalle trappole di spam, ma gli spammer hanno appreso che, poiché i filtri alimentati da trap (come DNSBL) impiegano alcuni minuti per propagare le loro conoscenze, un volume molto elevato funzionerebbe perfettamente se l'intera campagna di spam è stata completata per prima. Questo si adatta al principio del "passo leggero" che ha dato il nome a questa classe di spam, anche se oggi è meno applicabile.

12
Adam Katz

Il post potrebbe essere ben posizionato per una determinata parola chiave in Google. Pochi giorni dopo la scrittura del post, l'autore può aggiungere un collegamento alla firma dell'account.

2
Christian