Pubblicato il 14/03/09 - aggiornato il  | 18 commenti :

In un blog su Blogger quali sono le stringhe più efficaci per l’invio delle Sitemap?

Dando uno sguardo alle informazioni sulle Sitemap di Google si apprende che ce ne sono di diverso tipo a seconda del sito che contribuiscono ad indicizzare. E’ interessante questo estratto

Le Sitemap sono particolarmente utili se:

  • Il sito presenta contenuti dinamici.
  • Il sito contiene pagine che non sono facilmente individuabili da Googlebot durante il processo di scansione, ad esempio pagine con contenuti Flash o AJAX.
  • Il sito è nuovo e pochi siti contengono link al tuo sito. Googlebot esegue la scansione del Web seguendo i link da una pagina a un'altra, pertanto se pochi link puntano al tuo sito potrebbe essere difficile individuarlo.
  • Il sito dispone di un archivio consistente di pagine di contenuti che non sono molto ben collegate l'una all'altra oppure non sono per nulla collegate tra di loro.

E’ altresì specificato che

Le Sitemap forniscono a Google ulteriori informazioni sul sito e si integrano ai normali metodi di scansione del Web. Prevediamo che ci aiutino a eseguire la scansione di più siti in modo più rapido, ma non possiamo garantire che gli URL della tua Sitemap vengano aggiunti all'indice di Google. I siti non vengono mai penalizzati per l'invio delle Sitemap.

Quindi si può esser certi su due cose

  • Inviare la Sitemap non vuol dire che siano indicizzati automaticamente tutti gli articoli del tuo sito
  • Comunicare delle Sitemap (notare il plurale) non è mai penalizzante per il sito

Le stringhe che utilizzavo per l’invio delle Sitemap (se si superano i 500 post è meglio dividere la Sitemap) le ho illustrate in questo post ed erano le seguenti

atom.xml?max-results=500&start-index=1
atom.xml?max-results=500&start-index=501
atom.xml?max-results=500&start-index=1001
atom.xml?max-results=500&start-index=1501

di cui ho utilizzato solo le prime due visto che ho superato i 500 articoli ma sono ancora lontano dai 1.000.

Nei commenti G3nN4rO mi ha fatto presente che si potevano usare anche stringhe diverse cioè

atom.xml?redirect=false&start-index=1&max-results=500
atom.xml?redirect=false&start-index=501&max-results=500
atom.xml?redirect=false&start-index=1001&max-results=500
atom.xml?redirect=false&start-index=1501&max-results=500

Le ho volute testare entrambe e ho avuto dei risultati contraddittori

image

Come vedete i due tipi diversi di stringhe hanno portato alla creazione di 4 Sitemap che sono state regolarmente scaricate da Google (OK), entrambe hanno inviato lo stesso numero di URL ma se si clicca su Dettagli a destra di ciascuna si scoprono cose interessanti.

image    image

La prima Sitemap ha permesso l’indicizzazione di 473 URL su 501 mentre la terza di 468 URL su 501. Lo stesso Google dichiara che è normale che non tutte le pagine vengano indicizzate

image

Per quanto riguarda la seconda e la quarta Sitemap il rapporto è diverso, nel senso se la prima stringa si era dimostrata più efficace con gli URL da 1 a 500, la seconda riesce ad indicizzare meglio quelli più recenti 

image    image

La prima ne ha fatti indicizzare 90 su 99 mentre la seconda 95 su 99.

Concludendo, visto che non ho trovato nulla che ostacoli l’invio di più di una Sitemap, sovrapposta ad un’altra come URL che indicizza, credo che manterrò l’attuale struttura visto che le due stringhe sono in un certo senso complementari.



La prima riesce ad indicizzare meglio gli URL passati e l’altra invece quelli più recenti.

Sono graditi commenti, considerazioni, esperienze personali, idee sull’argomento visto che in questo campo non c’è una vera e propria autorità in materia e tutto è sempre molto opinabile.





18 commenti :

  1. Ciao,
    volevo chiederti un tuo parere su questa possibilità di aggiungere "pubblicità nel blog con i clik sulle parole del testo.
    http://it.edintorni.net/affiliati/
    e ancora,
    sai se esiste uno script che genera per ogni categoria di messaggi nel blog l'elenco di tutti i titoli?
    spero di esere stato chiaro.
    Grazie

    RispondiElimina
  2. Ciao Parsifal...:)
    Ho un blog su blogspot da un pò di mesi, e tutto andava bene, compresi i contatti che, per quanto vogliamo ignorare, sono cmq importanti e forniscono uno stimolo a fare sempre meglio.
    Improvvisamente, dal 24 febbraio scorso, i contatti sono diminuiti...la mia inesperienza mi ha portato inizialmente a tralasciare il problema, e pensare a qualche fattore su cui non potevo incidere personalmente...

    dopo un pò, l'andamento negativo continuava, ed a questo punto, ho spulciato un pò nel dietro le quinte del blog...ed ho scoperto avere lo stesso problema che, a quanto ho letto, hai avuto anche tu...

    Robots.txt ha bloccato ben oltre 330 link....e questo a partire proprio dal 24 febbraio

    Non so cosa fare...ho scritto al Forum di Google, e non mi hanno saputo risolvere il problema, e dopo aver letto un pò, avevo pensato di dover modificare il file robots.txt...ma, come avevo intuito, ho avuto da te la conferma che tutto questo non era possibile farlo..

    tu hai risolto il tuo problema?
    Mi puoi essere di aiuto?
    Ti ringrazio in anticipo e ti faccio i complimenti per questo sito estremamente professionale che curi, si vede, con grande dedizione..:)

    Ciao

    RispondiElimina
  3. @Vit
    Per quanto riguarda la prima domanda è indubbiamente una possibilità interessante. Per adesso rimango fedele ad Adsense. Il problema di queste pubblicità alternative è che non ti dicono mai chiaramente se possono essere messe insieme ad Adsense. Ho letto le FAQ del sito che hai scritto ma non ho trovato niente in proposito.
    Riguardo alla seconda domanda, tu vorresti, se ho capito bene, che nel momento in cui scrivi p.e. "widget" tutti gli articoli che hanno questa tag venissero visualizzati; non so quanto potrebbe essere utile perché appesantirebbe parecchio la pagina e non so se esiste per Blogger, per WordPress è probabile hanno migliaia di plugin.
    Io ho provato qualche tempo fa lo script Aspire con il quale potevi collegare ad ogni parola del blog pubblicità, definizione in Wikipedia, articoli correlati, quindi potrebbe fare al caso tuo. Lo avevo trovato in un articolo di Robin Good ma adesso non riesco a rintracciarlo. L'ho tolto però dopo poco tempo perché il sito era diventato non più navigabile.

    @Benno
    Per quanto riguarda la diminuzione dei contatti, nel senso dei lettori, questo è successo a tutti con l'unificazione dei due widget (followers e amici su Google). Leggiti quest'articolo in proposito che forse potrebbe esserti utile
    http://parsifal32.blogspot.com/2009/03/finalmente-ecco-le-istruzioni-per-gli.html
    Per quanto riguarda la non indicizzazione delle cartelle con Search questo è tipico di Blogger ed è presente in tutti i blog del tipo blogspot. Erroneamente credevo fosse un problema ma non lo è perché gli articoli continuano ad essere indicizzati mentre evitano di farlo con le etichette per non duplicare le indicizzazioni. Il file robots.txt non può essere modificato e non serve farlo. Dopo una settimana di calo vistoso delle visite questo blog ha ripreso ad avere i lettori soliti e anzi ad aumentarli.
    Per fare un'analisi del tuo problema dovrei avere più dati come
    1)Le pagine viste sono diminuite?
    2)La diminuzione riguarda Google?
    3)Scrivi meno post?
    4)In passato eri andato in Homepage di OKNOtizie e adesso non ci vai più?
    Se invece la cosa si limita ad una contrazione dei lettori è solo un problema del widget che risolverai avvertendoli di seguirti in modo pubblico anziché anonimo.
    Ciao

    RispondiElimina
  4. Grazie Pars,
    però aspetta, per la seconda domanda non sono stato chiaro:
    se clicco su widget mi si aprono tutti gli articoli inseriti in questa categoria tu ne hai 23, (basta passarci sopra con il mouse)io chiedevo se invece di aprire 23 articoli mi comparisse solamente l'elenco dei 23 TITOLI dei post.
    ciao e grazie ancora.
    PS.per la pubblicità resto della tua opinione. :-)

    RispondiElimina
  5. @Vit
    Avevo capito più o meno quello che intendevi. Se esiste uno script di questo tipo non lo conosco, potrebbe essere un'idea, magari mettendo un limite massimo alle visualizzazioni, p.e. 5 per ogni etichetta; non lo so se qualcuno ci ha già pensato. Una realizzazione di questo tipo è al di sopra delle mie possibilità :-(

    RispondiElimina
  6. Ciao Parsifal
    ti ringrazio per l'attenzione, ed in effetti cercherò ora di essere più chiaro.
    In realtà tutto è cambiato da un giorno all'altro, senza che nel blog, in realtà cambiasse nulla...ecco la cosa che mi preoccupa di più. Se avessi modificato la gestione del blog, se avessi fatto qualche passo falso potrei ricondurre questo vistosissimo calo di visite a qualcosa, invece niente di niente...

    Le pagine viste sono in ogni caso diminuite, ma non in maniera palese quanto le visite, gli ingressi. Come tu mi hai anticipato, il problema riguarda proprio Google. Grazie alle statistiche del contatore Shinystat, ho notato che gli ingressi da Google stanno diminuendo sempre di più, dopo una ascesa durata mesi e che lasciava presumere almeno un andamento costante.
    Le visite da Google sono oramai pari a meno di un terzo del valore passato, ed analizzando meglio, da Google ho solo ingressi per quanto riguarda le immagini....ma ingressi grazie a Keywords specifiche sono oramai nulli....
    Rispondendo alle tue domande, non scrivo meno post, anzi...nè tantomeno in passato andavo su OkNotizie.

    Ecco quindi la cosa che mi sta portando molti, ma molti dubbi. E' una situazione che oramai dura dal 24 febbraio, ed inesorabilmente sta peggiorando sempre di più, senza che io possa o sappia fare nulla. Ed il tutto, mi ripeto, d'improvviso, in maniera repentina, dopo che il numero di visite nel mio blog, (sia quello totale che quello da Google), aveva raggiunto livelli cmq molto buoni, soddisfacenti.

    Io, in questa fase finale, avevo affidato la totale responsabilità a questo robots.txt, ma a quanto ho capito, in ogni caso rimane qualcosa che non si può modificare.

    Non so proprio cosa fare. Se ho compreso bene, tale situazione, per il tuo blog, è durata una sola settimana. A me oramai si tratta quasi di un mese......

    Ti ringrazio moltissimo per la tua professionalità e gentilezza.
    Benno

    RispondiElimina
  7. @Benno
    Mi pare di capire che Google "ha smesso di volerti bene" senza una ragione specifica. Mi sento di escludere che tu possa aver fatto compravendita di link o altri giochi sporchi da Webmaster di pochi scrupoli, quindi la ragione è secondo me da ricercare in queste possibili cause
    1)Hai messo dei link in uscita verso siti porno
    2)Ci sono link in uscita verso siti di scommesse e cose di questo tipo
    3)Ci sono link nei post verso siti in cui è presente del malaware come virus, trojan e roba varia
    4)Hai avuto dei commenti in cui i commentatori hanno lasciato dei link attivi verso siti di cui ai punti precedenti
    Controlla queste cose, specialmente il punto 4) che è il più insidioso.
    Se vuoi avere altre idee su come procedere leggiti questo articolo di Robin Good che ha avuto una disavventura simile alla tua che è durata due mesi
    http://www.masternewmedia.org/it/online_marketing/penalizzazione-di-Google/possibili-cause-penalizzazione-di-Google-20070904.htm.
    Quando risolvi fammi sapere.
    Ciao

    RispondiElimina
  8. Parsifal
    non so come ringraziarti per la gentilezza con la quale stai accogliendo questo mio momento di grande difficoltà.
    Hai perfettamente ragione, e Google ha proprio "smesso di volermi bene". Ti posso garantire che nulla di quanto tu hai detto è stato fatto...nessuna compravendita di link, nessun gioco sporco da webmaster...

    Ho letto l'articolo di cui mi hai fornito il link. Ho compreso quindi il problema, solo che, a differenza di altri casi, in questo non vale il "mal comune, mezzo gaudio"..Questo perchè, purtroppo, sconto la mia inesperienza, la mia ignoranza cmq in questa materia.
    Mi sono rivolto disperatamente al forum di Google e non mi è stata data alcuna soluzione.....

    Proprio per questo ti ringrazio ancora, visto che mi stai aiutando moltissimo,...ho analizzato i quattro punti che mi hai fornito..

    1) lo escludo del tutto, a meno che non sia stato fatto da altri siti che volevano rovinare il buon andamento di visite del mio sito..proprio per questo cercherò, sperando di saperlo fare...
    2) idem al primo punto. Personalmente non è stato fatto nulla ma, se possibile, non posso escludere che sia stato fatto ciò da altre persone..
    3) penso di no, visto che controllo sempre per bene i pochi link che fornisco, e sono cmq rivolti interamente a siti di importanti quotidiani nazionali
    4) credo di no, visto che controllo sempre e, quando accaduto, ho subito cancellato con prontezza...

    In ogni caso, cercherò ora di fare un controllo sicuro e profondo. Al tempo stesso, se può interessarti, potrei mandarti tramite mail il link al mio sito, con relativo grafico di Shinystat in cui si evidenzia il crollo di Google...

    E' un qualcosa di molto brutto però. Oramai si tratta di quasi un mese, e credo che questa situazione non troverà soluzione. Si andrà forse in peggio e non in meglio. Il cambio di piattaforma cmq mi scoraggia visto che, da un giorno all'altro, Google può rovinarti il lavoro di tanti giorni...

    SAluti e grazie ancora
    Benno

    RispondiElimina
  9. @Benno
    Mi rendo conto della frustrazione, è una sensazione che ho provato anch'io ed è ancora più intensa perché dovuta ad un'ingiustizia.
    Purtroppo gli algoritmi di Google talvolta commettono di questi errori. Un'altra possibilità che mi viene in mente per questa tua penalizzazione sarebbe quella di un link scorretto nel modello, ma se non lo hai cambiato e prima andava tutto bene anche questa è da escludere.
    Quello che mi sento di dirti è che in genere queste ingiustizie informatiche hanno un termine, spero che questo arrivi prima possibile.
    Per quanto riguarda il grafico non è che mi possa dire di più di quello che mi hai già detto.
    Mi dispiace di non esserti stato di maggiore aiuto.
    Ciao

    RispondiElimina
  10. Grazie ancora Pars,
    magari se lo trovi fammi un fischio. :-)

    RispondiElimina
  11. Parsifal
    ti volevo in ogni caso ringraziare moltissimo...:) sei stato estremamente gentile.
    Non so cosa significhi, ma gli Url limitati da robots.txt sono calati da 330 a 91..nonostante i contatti non facciano ancora faville..:)

    però almeno questa cosa è incoraggiante..:)
    grazie ancora
    Benno..:)

    RispondiElimina
  12. io avevo inviato questa stringa:
    feeds/posts/default?alt=rss&max-results=500
    ma mi dava solo 140 URL indicizzati
    ho provato a inviare quelle che consigli tu... ti saprò dire!
    Grazie

    RispondiElimina
  13. Per il mio blog, ho inviato a Google queste stringhe:
    atom.xml?max-results=500&start-index=1 ,
    atom.xml?redirect=false&start-index=1&max-results=500 , e anche
    atom.xml?redirect=false.
    E' normale che Google mi indicizza esattamente la metà dei URL inviati?
    Esiste qualche strategia per aumentare il numero dei URL che non sono stati indicizzati?

    RispondiElimina
  14. @CS
    Google indicizza solo una parte dei post che può essere anche la quasi totalità per i siti ad altro Page Rank e invece una piccola percentuale per i blog per esempio con gli articoli importati.
    Una strategia per aumentare le indicizzazioni la puoi trovare qui
    http://parsifal32.blogspot.com/2010/03/sitemap-google-indicizzare-post-elenco.html
    Ciao

    RispondiElimina
  15. Grazie mille!
    Vado subito a leggere il tuo post
    Ciao

    RispondiElimina
  16. Sto per superare i 500 posti è conveniente dunque inviare nuovamente la sitemap a google?

    Ma lo posso fare subito o devo attendere di aver superato i 500 post?

    RispondiElimina
  17. @angie
    Devi inviare una seconda sitemap. Se la mandi prima di avere superato la soglia ti indicizzerà solo la homepage. Puoi aspettare con tutta tranquillità di superarla ricordando che molti siti neppure la inviano la sitemap e che sono indicizzati lo stesso.

    RispondiElimina
  18. Ernesto ti ringrazio davvero tanto di questa illuminante risposta.

    Grazie mille tornerò a trovarti, sei in gamba.

    Ciao
    Angie.

    RispondiElimina

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti. Se ti ho aiutato con il post o con le risposte ai commenti condividi su Facebook o su Twitter. Grazie.