Bloccare la copia delle immagini da un referrer spam

0
1352
sito avvoltoio immagini

Era da un po’ di tempo che ho notato un sito tra i miei referrer che come prassi copia, da questo e diversi altri domini, tutti gli articoli e le immagini correlate per popolare le sue pagine, pescando automaticamente dai feed RSS. Questo sito “clona contenuti” le immagini in realtà non le copia, ma le ingloba sulle sue pagine mediante tag img richiamando il file direttamente dal server proprietario utilizzando così le risorse a livello di host dei siti bersaglio, per mostrarle poi nelle sue pagine.

Oscura la sua strategia, perchè se prima il “clona sito” guadagnava grazie a Adsense, ad oggi non compaiono più annunci sponsorizzati, penso a seguito di ban. Immagino poi che non vi sia una pianificazione SEO dietro al “sito fotocopia” in quanto dopo l’introduzione di Panda, l’algoritmo di Google nato appositamente per penalizzare “siti avvoltoio” di questo tipo, copiare contenuti senza mai inserirne di propri equivale ad un suicidio in termini di visibilità.

Forse il suo intento è quello di danneggiare in piena ottica Black Hat SEO le pagine dei domini da cui attinge i contenuti, grazie all’azione di Google Penguin e alla mole di link di scarso livello, provenienti da contenuto duplicato, che indirizza verso i domini bersaglio sparsi per il globo.

Come bloccare la copia automatica di contenuti e immagini dai feed RSS

Dopo aver visitato le pagine del “sito carta carbone”, alla infruttuosa ricerca di un contatto per chiedere gentilmente di evitare la copia (non richiesta) dei miei contenuti ho provato a trovare una soluzione a questo problema.

Per far questo ho deciso di modificare il mio file htacces per inibire l’uso delle mie immagini dal dominio in oggetto.

RewriteEngine On
RewriteCond %{HTTP_REFERER} nome-del-sito-ruba-risorse\.com [NC]
RewriteRule .* - [F]

Non soddisfatto ho poi bloccato totalmente l’accesso del referrer al mio dominio mediante la seguente regola:

# BAN USER BY IP/DOMAIN
order allow,deny
allow from all
deny from nome-del-sito-ruba-risorse.com

Con questa regola ho un “poco esagerato” e inibito all’intero dominio di accedere a tutte le risorse su questo sito compreso i feed rss, non permettendogli così di copiare in automatico i contenuti.

Unico problema, non da poco, è che il proprietario del sito “clona contenuti” mi sembra che utilizzi una tecnica old style per replicare gli articoli: il classico copia e incolla, su cui ho paura che si possa fare poco, per cui unica soddisfazione rimane il fatto che ora non può inglobare le immagini se non caricandole e salvandole sul suo sito.

Con una regola nel file .htaccess possiamo evitare che un dominio inglobi le nostre immagini Condividi il Tweet

Evitare penalità dai link in ingresso con il disavow tool

Non contento ho poi effettuato un intervento di disavow del link, mediante il tool offerto da Google Search Console, per interrompere ogni “collaborazione” non voluta a livello di link.

Sono poi andato sullo strumento per rifiutare i link fornitomi da Google Search Console, ho selezionato questo dominio tra i diversi siti che ho agganciato alla console e ho premuto sul bottone Rifiuta Link.

rifiuta link google search console

Ho poi premuto sul tasto Rinnega Link accettando la clausola.

rinnega link google search console

Nell’ultima finestra che compare ho poi sottoposto il file contenente i link o i domini da “rinnegare”, dove ho inserito il dominio relativo al “sito copia”.

rinnega link

Vediamo nel dettaglio questa schermata:

  1. il nome del file contenente la lista di url/domini da rinnegare.
  2. Con il tasto Download possiamo scaricare il file, precedentemente caricato, per aggiornarlo e ricaricarlo, nel caso volessimo aggiungere/togliere link. Il file si può scaricare in formato CSV o Google Documenti.
  3. Con il bottone Elimina possiamo eliminare il file sottoposto a Google.
  4. Nella finestra dedicata ai Risultati relativi all’invio in data numero data possiamo comprendere il numero di domini e URL di cui richiederemo la rinnegazione.
  5. Con il bottone Selezione file scegliamo, dal nostro computer, il file testuale con i domini da rinnegare da caricare nello strumento per i Disavow dei link, che andrà a sostituire e sovrascrivere quello precedente.
  6. Una volta che il file è stato caricato e dopo l’analisi, nel caso non ci siano errori, possiamo inviare la richiesta di negazione dei link premendo sul tasto Invia.
  7. Con il bottone Fine chiudiamo la finestra.

Come creare un file per il disavow

Per creare un file con cui chiedere il disavow dei link che rimandano al tuo sito è necessario utilizzare un editor che ci permetta di creare un file .txt codificato in charset UTF-8 o ASCII a 7 bit.

Per fare un nuovo file di questo tipo su Windows possiamo utilizzare Blocco Note.

blocco note utf-8

L’importante è, nel momento in cui scegliamo di salvare il file, di selezionare come formato il .txt e nella codifica selezionare UTF-8.

All’interno del file possiamo inserire o un singolo URL o un intero dominio (ad esempio per il caso in esame in questo articolo ho inserito l’intero dominio). Per ogni elemento che andrete ad inserire all’interno del file vi consiglio di aggiungere un commento di spiegazione.

Un esempio di file potrebbe essere il seguente:

# A seguito di contatto il webmaster
# non ha rimosso i seguenti link
http://spam.esempio.it/articolo-spam.html
https://www.spam.it/altro-articolo-spam.htm
# Non è possibile contattare l'amministratore del sito
domain:dominio-clone.com

Attenzione! L’opzione per rinnegare i link in ingresso va usata solamente se non riuscite a far togliere i link ai vostri contenuti non voluti mediante contatto con il webmaster.

Con il #disavow di Google Search Console possiamo rinnegare i link evitando penalità da #Penguin Condividi il Tweet

A seguire alcuni screenshot con spiegazione di un esempio di articolo copiato presente sul “sito clone”, prima dell’intervento al file htaccess e dopo aver aggiunto la regola per evitare la copia delle immagini dal dominio incriminato. Premi su PRIMA o DOPO per vedere le schermate relative all’intervento sull’.htaccess

Cosa ne pensate? Secondo voi avrei potuto agire diversamente?

LASCIA UN COMMENTO