
photo credit: broken thoughts
Una dei segreti meglio celati da Google è l’esatto numero di pagine indicizzate di un sito (no, il numero presentato a seguito di un [site:nomesito] mi irrita e basta). L’unico modo noto (almeno a me) fino a qualche tempo fa era fare usare l’operatore inurl e vedere se saltava fuori o meno un riusultato. Peccato che questo sia anche un ottimo modo per farsi bannare l’IP da Google dopo una decina di query, cosa che scatena le ire dei colleghi se lavorate in una azienda e vi capita alle 10 del mattino. Qualche tempo fa però mi sono accorto d una informazione che era li, davanti a me, ma non ci avevo mai fatto sufficiente attenzione.
Ebbene si, nella sezione Sitemap XML del pannello di Google Webmaster Tools viene data una chiara indicazione di quante URL sono indicizate rispetto a quelle contenute nella Sitemap XML. Questo è l’unico punto dove Google si sbilancia nel dare questo tipo di informazione per cui val la pena sfruttarla. Per siti di una certa complessità potrebbe essere utile creare molte sitemap dedicate a sezioni specifiche del sito in modo da avere una idea almeno in percentuale dello stato di indicizzazione di ciascuna sezione.
Per chi non ha voglia di smanettare sulla sitemap c’è sempre un buon vecchio metodo: tutte le pagine che hanno ricevuto almeno una visita dai motori di ricerca nell’ultimo mese hanno ottime probabilità di essere indicizzate, quindi basta mettere le mani allo strumento di web analytics di vostra fiducia.
Se qualcuno ha qualche idea in più per capire esattamente se una pagina è indicizzata o meno (un metodo che non porti al ban) sono tutto orecchie, ma non parlatemi di usare le API di Google perché altrimenti divento cattivo


