Le sitemap

Le sitemap

map

Il concetto di sitemap non è nuovo. Vengono utilizzate dagli albori del web, anche se allora erano destinate ai visitatori in carne ed ossa e quindi erano normali pagine HTML. Il fatto che potessero aiutare anche l’indicizzazione da parte dei motori di ricerca era solo un beneficio secondario. Le sitemap in HTML sono una collezione organizzata dei link alle sezioni principali di un sito, una sorta di sommario dei contenuti. Le sitemap in HTML sono tuttora il pane quotidiano di chiunque si occupi di SEO, visto che continuano ad essere le più diffuse. Con il passare degli anni, i motori di ricerca hanno capito i vantaggi delle sitemap. Google iniziò ad utilizzare questa idea nel 2005, con la creazione del proprio Google Sitemap Protocol.

Poco dopo, anche Yahoo!, Microsoft, Ask e IBM salirono sul carro. Nel 2006 il Google Sitemap Protocol fu ribatezzato XML Sitemap Protocol, per sottolineare la sua connotazione “universale”. Questi sforzi comuni sono ora sotto gli auspici di Sitemaps.org. L’idea che sta dietro l’XML Sitemap Protocol è quella di aiutare i motori di ricerca ad indicizzare più velocemente le pagine fornendo, allo stesso tempo, una tecnologia utile per migliorare gli algoritmi utilizzati dagli spider per decidere come seguire i link che trovano durante il loro vagare per il web.

Notate che l’uso di questo protocollo, oltre a non essere obbligatorio, non garantisce nulla in termini di miglior posizionamento nelle pagine dei risultati. Vale anche il contrario: se un sito non utilizza il formato XML per le proprie sitemap, non verrà penalizzato dai motori di ricerca. Perché usare le sitemap? L’uso delle sitemap è importante poiché aiuta il visitatore a raggiungere velocemente le informazioni di cui ha bisogno e aiuta gli spider a trovare i link. Non esiste una ricetta di sitemap valida per ogni sito.

Conoscere le opzioni a disposizione è importante per poter fare le scelte più opportune in base alle proprie esigenze. Ecco alcuni dei motivi per cui vale la pena utilizzare le sitemap. Incremento delle visite da parte degli spider Sebbene gli spider siano in continuo miglioramento, il loro funzionamento è ancora lontano dalla perfezione e i motori di ricerca non hanno problemi ad ammetterlo. Ecco cosa dice Google a proposito dell’incremento delle visite degli spider:

“... inviarci una sitemap vi aiuta ad essere sicuri che Google sia a conoscenza dell’esistenza degli URL del vostro sito. Può essere molto utile se il vostro contenuto non è facilmente raggiungibile dai nostri spider (come accade per le pagine accessibili solo attraverso una form). L’uso delle sitemap non costituisce tuttavia una garanzia che gli URL vengano effettivamente visitati e indicizzati dai nostri spider. Utilizziamo le informazioni presenti nelle sitemap per migliorare il meccanismo di scoperta degli URL utilizzato dai nostri spider.”

Strutture di link inadeguate

Non tutti i siti vengono creati allo stesso modo. I siti con strutture di link poco chiare tendono ad essere indicizzati male. Pagine orfane, link troppo profondi e la presenza di trappole per i motori di ricerca sono esempi tipici che portano a problemi di indicizzazione. L’utilizzo delle sitemap aiuta a risolvere questi problemi temporaneamente, in attesa che la struttura degli URL venga corretta. La frequenza delle visite degli spider Uno dei maggiori vantaggi dell’utilizzo delle sitemap deriva dalla possibilità di controllare la frequenza delle visite degli spider.

Le sitemap in formato XML permettono infatti di dire con precisione agli spider quanto spesso devono indicizzare una data pagina. I siti che utilizzano le sitemap tendono ad essere visitati più accuratamente da Yahoo! e da Google. Questi due giganti del web ci mettono infatti solo pochi minuti per reagire all’invio di nuove sitemap, cosa che risulta molto utile per i siti nuovi o per tutti quei siti che vengono aggiornati molto frequentemente. Proprietà dei contenuti Sul web esistono in agguato molti spider malevoli. Il fatto che i motori di ricerca possano indicizzare un sito tempestivamente è un ottimo modo per assicurarsi che i contenuti risultino attribuiti a chi li ha effettivamente prodotti. In questo modo un sito “copione” difficilmente verrà contrassegnato come autore del contenuto.

Priorità delle pagine

Come vedremo più avanti in questo capitolo, l’XML Sitemap Protocol permette ai webmaster di assegnare una specifica priorità ad ogni URL. Fornire suggerimenti ai motori di ricerca circa l’importanza di ciascuna pagina può essere molto utile, specialmente se si sta combattendo per PageRank concorrenziali. Siti di grandi dimensioni L’utilizzo delle sitemap è particolarmente importante per i siti di grandi dimensioni. I siti che contengono decine di migliaia (o addirittura milioni) di pagine spesso hanno problemi di indicizzazione dovuti a link troppo profondi. L’uso di più sitemap, ciascuna dedicata ad una particolare sezione del sito, diventa in questi casi essenziale.

Storico delle modifiche

Se tutti i link di un sito compaiono in una stessa sitemap, la sitemap diventa anche un ottimo strumento per tracciare le modifiche del sito, in particolare se viene inserita in un sistema di controllo delle versioni dei file.