immagine di sfondo articolo
Search Engine Intelligence tempo di lettura: 8 min

Dopo quanto si indicizza un nuovo sito e come?

Dopo quanto si indicizza un nuovo sito e come?

Articolo datato

Questo articolo non è più aggiornato da almeno 4 mesi perciò verifica le informazioni che vi sono contenute in quanto potrebbero essere obsolete.

Scrivo questo articolo solo dopo parecchio tempo a causa di parecchie e enormi novità in casa posizionamento-seo e per questo non me ne abbiate a male.

Nell'attività di analisi del lancio di un nuovo sito è necessario comprendere il suo comportamento su motore di ricerca Google e nel dettaglio effettuare un esame dell’indicizzazione delle sue pagine nelle diverse SERP di pertinenza, per poi passare alla fase successiva, ossia al posizionamento.
Sommario

Attenzione ho espressamente fatto differenza tra INDICIZZAZIONE (ossia l’attività di crawling dello spider e dell’inserimento nell'indice del search engine) e POSIZIONAMENTO (ossia raggiungere delle posizioni valide, tipo i primi risultati sulla SERP nella prima pagina, per le query per cui abbiamo ottimizzato il nostro portale).

Indicizzazione ≠ Posizionamento, ma comunque una attività fondamentale nella #SEO, vediamo perchè Share on X

L'attività di indicizzazione

Il primo passo per posizionare un sito è quello di far "vedere" le nostre pagine. Se i nostri URL non vengono inseriti nell'indice del motore di ricerca il nostro sito non si potrà mai posizionare.

Solo dopo aver controllato che il nostro sito si sta correttamente indicizzando possiamo pensare di ottimizzare le nostre pagine per farle posizionare.

Il lavoro dello spider

Per comprendere come lavora un motore di ricerca nell'acquisizione di nuove risorse da schedare utilizziamo una semplice metafora: lo spider è un’auto che vaga in esplorazione per le autostrade della rete con il compito di trovare nuove risorse da consigliare alla propria utenza e per scegliere la propria destinazione ha dalla sua diverse risorse per compiere al meglio questa attività.

Ecco cosa potrebbe utilizzare lo spider di un motore di ricerca per trovare risorse da includere nel proprio indice:

  • La segnalazione di un utente dell’intero sito (collegare search console al proprio sito);
  • La segnalazione di un utente di un singolo URL (inserimento di un singolo URL in search console);
  • La sitemap.xml (inserita direttamente in search console);
  • La sitemap.xml (linkata nel file robots.txt);
  • I link interni ad un sito;
  • I link tra un sito e l’altro (i social sono dei siti eh, che vengono letti più o meno dagli spider a seconda dei casi);

Inserire un sito nell'indice di Google

Di mio tendenzialmente, una volta realizzato un sito già ottimizzato lato SEO (nel prossimo paragrafo ti accenno meglio ad una parte di questa mia puntualizzazione), lo collego a Search Console con più di un metodo (ad esempio url caricato via FTP, collegamento ad Analytics, metatag), inserisco la sitemap nel file robots e comunque la offro in pasto mediante l’apposita sezione in GSC Scansione > Sitemap > Aggiungi/Testa sitemap.

Poi utilizzo un tool che tutti i consulenti SEO smaliziati utilizzano a profusione: la pazienza. Ossia conscio di aver fatto tutte le cose correttamente non effettuo ulteriori azioni e aspetto che il sito venga scansionato naturalmente dallo spider. Ti dico questo per puntualizzare che nell'attività di posizionamento di un sito per un cliente è necessario fare le cose con sicurezza, per gli esperimenti consiglio di realizzare siti dedicati (che poi è anche divertente, non sapete quanti paciocchi si possono fare e alcune volte i risultati sono come quando costruiamo un enorme castello di sabbia in spiaggia e poi arriva un’onda o il classico bullo a distruggere tutto. Il bullo è negative seo e lo si picchia usando diversi strumenti cacciandolo via, l’onda è Google che ci ha detto hai sbagliato in qualcosa nel costruire il tuo sito li e ora ne paghi le conseguenze).

Come controllare se un sito viene indicizzato

Come vi ho accennato prima, di mio segnalo la presenza di un nuovo sito web al motore di ricerca solo dopo che ho controllato che sia ottimizzato lato SEO ossia dopo aver controllato che tutto sia a posto tecnicamente (ad esempio controllando robots.txt, sitemap.xml, effettuando una scansione con Screaming Frog/Visual SEO studio per l’analisi di possibili link interni con errore 404), che il menù di navigazione abbia una struttura corretta e studiata in base all'analisi delle query con cui lo si vuole posizionare in modo tale che lo spider capisca la priorità delle pagine da scansionare, più naturalmente tutte la altre attività SEO on-site del caso che non vi descrivo in questo articolo perché altrimenti non la finiamo più e andiamo fuori argomento.

Vediamo quindi alcuni degli strumenti che abbiamo a disposizione per comprendere l’indicizzazione di un sito web.

Visualizza come google

Eh ma che c’entra? Hai detto strumenti per capire se un sito è indicizzato! Si ma se lo spider del motore di ricerca non riesce ad accedere al tuo sito e a renderizzarlo correttamente come fai a farlo indicizzare? Se il menù di navigazione non viene visualizzato come farà lo spider a navigare tra le pagine? Quindi vai su Search Console > Scansione > Visualizza come Google, fai un recupera e visualizza e controlla che il tuo sito sia renderizzato correttamente.

Tester del file robots.txt

Anche qui, non c’entra con l’analisi dell’indicizzazione di un sito, ma se da GSC > Scansione > Tester dei file robots.txt hai un messaggio di errore in cui ti viene detto che il file blocca alcune risorse o che vi sono errori all'interno, sicuro il tuo sito non verrà indicizzato o ne verrà scansionata solo una parte.

Attenzione che se hai mandato online il tuo sito impostando il file robots.txt per bloccare la scansione dello spider e poi l’hai aperto prima di includerlo in GSC se il file è stato inserito in cache vi è il rischio che il suo aggiornamento avvenga in seguito, causando un ritardo nell'indicizzazione del sito.

Il comando site

Grazie all'operatore site:nomedominio.tld puoi verificare se il tuo sito è presente nell’indice di Google.

Attenzione! I risultati non sono attendibili, variano da connessione e periferica, non vengono restituiti in funzione dell’esatto momento in cui un contenuto è stato indicizzato e variano nel tempo. Per cui questo comando è da utilizzare come controllo ON/OFF: se restituisce sempre più risultati pertinenti relativi al tuo sito con il passare del tempo, il tuo dominio si sta indicizzando in maniera corretta (fino ad un massimale pari al numero complessivo di URL del tuo sito).

Di mio l’ho utilizzato recentemente mandando online un nuovo sito e controllando quali pagine si sono indicizzate prima (tipo quelle nei menù principali di navigazione) e notando che la pagina “Normativa sui cookie” è stata una di quelle indicizzate prima pur se con metatag “noindex”. Per questo ho prontamente modificato  tutti i link a quella pagina a “nofollow”, anche se interni al sito, per evitare spreco di crawl budget facendo attenzione a aggiungere l’attributo “nofollow” anche al popup con l’informativa breve che compare la prima volta che si visita il sito. Questo ha aiutato lo spider di Google a scansionare solamente le risorse pertinenti e in argomento con le parole chiave per cui vorrei far posizionare il dominio.

GSC - Statistiche di scansione

Anche questa sezione della search console non ci permette di capire se il nostro sito è indicizzato, ma è molto importante per vedere se lo sarà in seguito. Quindi se lo spider pian piano scansiona più pagine allora, come direbbe il narratore de L’odio siamo al punto in cui “fino a qui tutto bene” (il tuo sito incomincia a piacere a Google);

Analisi dei log di accesso al sito

Se non ti bastano le statistiche di scansione segnalate in search console puoi analizzare i log di accesso al tuo sito estratti dal tuo web server evidenziando il passaggio del bot di Google. Lo riconosci dallo user-agent .

Wordpress: utilizzare Wordfence per capire l’attività dello spider

Se hai Wordpress puoi utilizzare Wordfence, un plugin per la sicurezza, per analizzare se nel tuo sito passa effettivamente lo spider di Google e con quale frequenza, utilizzando la sezione “Live traffic” e filtrando il traffico per “Google Crawlers”. Molto interessante per capire QUALI pagine vengono scansionate in tempo reale.

GSC -Sitemap

La sezione sitemap della Search Console permette di capire quali e quante pagine e immagini si stanno indicizzando rispetto a quelle globali fornite al motore di ricerca. Tendenzialmente le pagine inviate e quelle indicizzate nel migliore dei casi dovranno coincidere e la crescita delle pagine indicizzate deve progredire nel tempo in maniera graduale.

Attenzione! Non confondete lo spider di Google e inserite nella sitemap solo le pagine che volete indicizzare escludendo quelle con metatag noindex e canonical.

GSC - Stato dell’indicizzazione

Questa sezione della search console lascia per alcuni aspetti il tempo che trova, ossia è utile per comprendere errori, risorse non indicizzate, etc ma non è ASSOLUTAMENTE aggiornata in tempo reale, anzi utilizza una frequenza di aggiornamento del tipo ACDC (non il gruppo rock eh, ma il metodo A C@zz0 di C@ne) e i valori cambiano da un giorno all’altro.

Per fare un esempio guardate questo grafico dello stato dell’indicizzazione

Esempio di stato indicizzazione in Google Search Console

e confrontiamolo con le pagine indicizzate rispetto a quelle inviate con la sitemap

Esempio di analisi sitemap in Google Search ConsoleDirei che non c’è stato una brusca indicizzazione degli URL di questo giovine sito, ma semplicemente che il grafico dello stato dell'indicizzazione è stato aggiornato alla condizione più o meno reale relativa al 30 aprile (e comunque la sitemap per quel giorno mi segnalava 77 pagine indicizzate e non 29).

Quando viene indicizzato un sito?

Bene, ma in sostanza QUANDO incominciano a comparire i risultati relativi ad un sito in SERP? Dipende:

  • Mai: non vi sono link esterni al tuo sito, non l'hai mai segnalato a Google, nessuno oltre a te è a conoscenza del dominio;
  • Mai: hai impostato male il file robots.txt o il file robots ha un errore e google schifa e odia i tuoi URL;
  • Mai: hai acquistato un dominio che pensavi davvero figo per fare il tuo nuovo sito, in realtà era stato fatto scadere e abbandonato perché super penalizzato da, ad esempio, una link building spam;
  • Dopo 7/15 giorni: se hai fatto le cose bene;

Site VS Stato dell'Indicizzazione VS Sitemap

In ultimo vi presento un raffronto tra i dati forniti dal comando site, ad oggi, dal pannello Stato dell'indicizzazione in GSC e della Sitemap sempre in Google Search Console per il sito che ho utilizzato in questo articolo come caso studio:

Comando Site al 4 maggio: 407 risultati

Risultati forniti dal comando site

Scheda Stato dell'Indicizzazione in Search Console al 30 aprile: 298 risultati

stato indicizzazione GSC

Scheda Sitemap in Search Console al 4 maggio: 356 risultati

sitemap GSC


Mi sono dimenticato qualcosa? Cosa usate voi per capire come e se è indicizzato il vostro sito?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Commenti

Rispondi 14-03-2018 11:30
Luigi
Buongiorno, per il mio sito ho fatto tutto quello suggerito nel articolo. Utilizzando il comando site:www.nomesito.it mi restituisce molte pagine indicizzate, ma se vado su google e digito (come farebbe un cliente) www.nomesito.it il mio sito non compare. Esce solo nei suggerimenti (in cima), es: Risultati relativi a... Cerca invece...... Tengo a precisare che il sito è online da 6 giorni.
Rispondi 15-03-2018 10:27
Pino
Ciao Luigi, il tuo sito ad ora è indicizzato. Per far si che sia anche posizionato hai da aspettare (se hai fatto le cose bene). Quanto? Beh un tempo variabile dal mese ai mesi. Come capire se si sta posizionando? Su Analytics incomincerai a vedere traffico organico proveniente dal motore di ricerca. Come capire se si posiziona per le query per cui hai fatto l'ottimizzazione? Search Console e strumenti per monitorare l'andamento del tuo dominio per determinate query (Seozoom, Semrusch, SEOprofiler, RankTrack, Ahref, etc etc)
Rispondi 15-03-2018 11:23
Luigi
Ciao grazie, ma anche essere presenti in serp per nome di dominio è un posizionamento?
Rispondi 15-03-2018 15:23
Pino
Si, www.nomedominio.tld o nomedominio.tld sono parole chiave come altre se ricercate su motore di ricerca.
Rispondi 16-09-2019 14:57
Andrea
Ciao Pino, ho indicizzato da gg il mio sito e lo vedo tranquillamente su google, ma perché facendo site:.nomemiosito.it..… non vedo indicizzata nemmeno un'immagine? o meglio gg fa ne ho viste qualcune e poi no, ma è presto? uso word press e le ho ottimizzate tutte. Sono foto inserite all'interno degli articoli. thanks
Rispondi 03-10-2019 15:43
Pino
Ciao Andrea, se facendo site:nomemiosito.it nella ricerca compaiono gli url del tuo sito, ma in immagini nemmeno una immagine forse hai qualche problema alla loro indicizzazione. Magari da quando hai fatto il primo check, rispetto al secondo, hai cambiato qualche cosa nel file robots.txt, nell'.htaccess o in altro che impediscono ai motori di ricerca di indicizzare i file immagine o la directory dove sono salvati.
Rispondi 26-04-2020 14:03
manuel
Ciao. Volevo chiederti un informazione. Sto facendo un e-commerce. Siccome ho preso in mano un lavoro non ben fatto, ho dovuto aggiustare diverse. Ultimato il primo step di pulizia, ora sto iniziando la link building. Chiaramente ho dovuto agire su permalink per rendere i link puliti e semplici da leggere levando le categorie e prodotti, semplicemente dominio e poi il nome della categoria o del prodotto. Chiaramente essendo in lavorazione da qualche mese, in automatico Google aveva già indicizzato dei contenuti che ora avendo cambiato permalink saranno tutti errori 404. A me questo non interessa per ora in quanto come ti dicevo prima sto iniziando il link building adesso, dunque per me parte tutto ora e anche se fosse da 0 non mi interessa. La mia domanda è... Google si aggiorna in automatico da solo con il link esatti ??? Premetto che ho già caricato sitemap.xml aggiornata Google Search Console. Grazie .
Rispondi 27-04-2020 08:36
Pino
Ciao Manuel, premesso che sarebbe meglio lavorare su una versione locale del sito per poi mandare in produzione la versione effettiva del sito una volta fatte tutte le modifiche di mio non avrei modificato i permalink dato che non sono un fattore seo diretto o, nel caso di modifica, avrei tenuto il prodotto in categoria sull'url in maniera tale da poter analizzare su analytics l'andamento di determinate categorie di prodotti. Ma questa non è una risposta alla tua domanda. Google aggiorna pian piano gli url ma ci impiega del tempo in base al crawl budget che il motore di ricerca ha dedicato al sito. Se lo spider del motore di ricerca sbatte contro dei 404 viene quindi sprecato il crawl budget. Di mio quindi farei così:
  • Scansione dell'intero sito, controllando che l'internal link non punti a link rotti o con redirect 301
  • Analisi delle money page (url più importanti) e degli url eventualmente posizionati e per questi effettuare dei redirect 301 nel caso l'url sia cambiato
  • Gli altri li lasci a 404

RI.DO.PC. - P.IVA 10902370013

© 2013-2024 Tutti i diritti riservati