Pubblicato il 13/03/12e aggiornato il

Come impedire l'indicizzazione da parte di Google di contenuti del nostro blog.

L'obiettivo primario dei blogger è quello di farsi indicizzare i post il più rapidamente possibile da Google che è il principe dei motori di ricerca ed è quello che porta la più importante percentuale di traffico.

Vediamo però le cose da un altro punto di vista. Ci possono per esempio essere dei contenuti del blog che non vogliamo assolutamente che vengano indicizzati. Si potrebbe trattare di dati personali che pur utili ai lettori non vogliamo che appaiano nelle ricerche. Un altro caso potrebbe essere quello di una divagazione rispetto all'argomento principale del post che è meglio non far indicizzare per evitare che Google faccia confusione riguardo al tema di cui si tratta nell'articolo.

Bisogna innanzitutto fare una premessa sul corretto significato di indicizzazione (indexing) e scannerizzazione (crawling). Impedire l'indicizzazione da parte di Google è cosa diversa da impedirne la scannerizzazione. Nel senso che il bot di Google può rilevare i contenuti di tutta la pagina ma si può inserire un comando per dirgli di non indicizzarne una parte.

Nella Documentazione di Google riguardo a questi temi c'è un capitolo che concerne appunto questa problematica. Fermo restando che per impedire la scannerizzazione di un sito o di una pagina occorre modificare il file robots.txt, cosa che è impossibile per gli utenti di Blogger, vediamo come si possa impedire l'indicizzazione di un particolare elemento mediante degli appositi tag proprietari di Google. Questo significa che utilizzando la tecnica che vado a illustrare si potrà impedire l'indicizzazione da parte di Google ma non quella di altri motori quali Yahoo, Bing, Ask, ecc.

I tag da utilizzare sono googleon e googleoff con questa sintassi

<!--googleoff: all-->
Tutto il contenuto del blog tra questi due commenti non sarà indicizzato
<!--googleon: all-->

Oltre a all possiamo usare altri attributi quali index, anchor e snippet con questo significato.

Solo il contenuto dopo questo tag <!--googleoff: index--> non sarà indicizzato <!--googleon: index--> mentre quello dopo quest'altro tag lo sarà.

<!--googleoff: anchor-->
<a href="#
">Idee per computer ed Internet</a>
<!--googleon: anchor-->

Con il tag anchor non sarà indicizzato l'anchor text del link ma il collegamento invece lo sarà. Si può usare quando vogliamo trasferire Page Rank a una pagina linkata ma non a quella determinata keyword.

<!--googleoff: snippet-->
Il testo inserito tra questi due tag non verrà mostrato come descrizione nei motori di ricerca
<!--googleon: snippet-->

Per concludere si mette il commento <!--googleoff: all--> prima del contenuto che non si vuole far indicizzare e l'altro commento <!--googleon: all--> quando si vuol far ricominciare la normale indicizzazione. Dove all può essere sostituito da index, anchor e snippet con i rispettivi significati.

 





13 commenti :

  1. ciao, volevo chiederti 2 cose.
    1) come facci a mettere un pulsante mi piace di facebook e twitter all' inizio dell' articolo (sotto il titolo)
    2) come faccio a mettere il benner adsense a destra e di fianco iniziare il post.
    GRAZIE

    RispondiElimina
    Risposte
    1. @Sairos
      Inserisci i codici di Fb e di Twitter in una tabella
      http://www.ideepercomputeredinternet.com/2011/06/come-allineare-i-bottoni-di-facebook.html
      e poi inserisci il codice nel modello prima della riga
      <data:post.body/>
      Per Adsense da mettere sulla destra del contenuto del post usi questo codice
      <div style='float: right; margin: 20px;'>
      Codice Adsense
      </div>
      dove puoi modificare il margine

      Elimina
    2. non trovo il codice nel modello.
      Quello per mettere mi piace sotto il titolo del post

      Elimina
    3. @Sairos
      Per mettere Mi Piace sotto il titolo del post devi inserire il codice sopra questa riga

      <data:post.body/>

      che deve esserci per forza. Se non la trovi è perché non hai messo la spunta a espandi modelli widget

      Elimina
    4. ragazzi non trovo la riga di codice con qualcuno può aiutarmi

      Elimina
  2. Questo tag si inserisce nell'HTML del post?
    Ma come impedire l'indicizzazione di un post? ossia impedire che il link di un post si possa cercare su google..
    Grazie

    RispondiElimina
    Risposte
    1. @Annalisa
      Con Blogger credo che la cosa non sia fattibile. Con Wordpress si può configurare il file robots.txt per non indicizzare alcune pagine ma con Blogger tale file è lo stesso per tutti e non possiamo accedervi

      Elimina
  3. Questo commento è stato eliminato dall'autore.

    RispondiElimina
    Risposte
    1. Questo commento è stato eliminato dall'autore.

      Elimina
  4. @...
    Forse dipende dal fatto che erano gia' state indicizzate. Probabilmente questo sistema e' efficace solo per post non ancora pubblicati (suppongo).

    RispondiElimina
  5. Attenzione che questi tag valgono solo per Google Enterprise Search http://www.google.com/enterprise/search/ (il motore di ricerca che si può installare a pagamento in un sito), non per l'indice pubblico di Google

    RispondiElimina

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti. Se ti ho aiutato con il post o con le risposte ai commenti condividi su Facebook o su Twitter. Grazie.