Parece ser que para muchos webmasters, es indispensable tener un sitemap.xml para aparecer en los buscadores…., es falso !!
Google sugiere incluirlo, pero no es indispensable hacerlo. Empecemos por saber que es lo que no hace:
- No indexa contenido por si solo.
- No desindexa las URLs que ya lo están.
Por lo tanto, tener uno o varios no garantiza una indexación segura, ni mucho menos un buen posicionamiento en el buscador. He visto blogs con mas de 100.000 páginas, con varios sitemaps y sin embargo sus publicaciones no alcanzan la relevancia necesaria para aparecer correctamente en los resultados.
De hecho un sitio web puede indexar perfectamente todas sus páginas sin ayuda de ningún sitemap, si los enlaces entre ellas son accesibles y la información que contienen es suficientemente relevante.
Entonces la pregunta es ¿para que sirve el bendito sitemap?.
Según su estructura XML, básicamente tiene 2 funciones.
- Indicar la cantidad de paginas del sitio en el rastreo superficial (FreshBot), e indicar la ruta del contenido, cuando los enlaces no existen o no son accesibles por los bots, ej. (Ajax, JavaScript, etc.)
- Indicar la fecha que se ha modificado o incluido la URL en el documento <lastmode>
Algunos generadores suelen incluir la frecuencia <changefreq> con que debe volver el robot a visitar una url, aunque esto último Google lo pasa por alto, no así algunos otros motores de búsqueda.
También te preguntarás; si una página ya fue indexada ¿para que debe estar presente en el sitemap?
Precisamente para indicar al robot que aun está en el indice del buscador. Imagina que tienes un restaurante pero la carta de menú no está completa, el cliente solo sabe que hay platos nuevos si el mesero lo sugiere, de otro modo come siempre lo mismo.
El sitemap es precisamente la carta menú de un sitio web, donde el cliente es el robot ;).
¿Entonces por qué hay sitios web con varios sitemaps?
Puedes tener la cantidad de sitemap que desees, utilizando un Sitemapindex. Esto es un sitemap que agrupa a los demás.
Por lo general se los suele ordenar por categorías o tipos de contenidos como imágenes.
Pero muchas veces es necesario dividir las entradas en varios sitemaps, porque dicho archivo tiene un límite de hasta 50.0000 URLs listadas, o incluso lo limita el tamaño que alcance con esa cantidad de entradas. Un sitemap no debe superar los 50 MB sin comprimir.
Bueno es saberlo.
Aunque las indicaciones de Google insistan hasta la saciedad en la conveniencia de dotar a cada web de su sitemap.xml, este no es la panacea universal para que nuestras queridas páginas tengan el sitio que se merecen entre las elegidos para la gloria perecedera de las primeras posiciones en los resultados de nuestro motor de búsqueda favorito.
Tal vez sea para economizar recursos por lo que Google (también Bing hace referencia) insiste en ello.
Hay una experiencia curiosa,ver http://www.google.com/sitemap.xml, el padre de todos los sitemaps.