Como crear un Google Sitemap.xml
Empecemos por decir que es un Sitemap.
Hay 2 elementos distintos a los que se les da este nombre:
- Una página Web donde se muestra el contenido de nuestro sitio, separado por secciones, con links a cada pagina. Es para ser leido por los visitants (humanos)
- Un archivo XML que contiene campos que pueden ser leidos por un buscador (crawler o robot) y que le permiten conocer la estructura del sitio Web que esta revisando.
En este caso nos estamos refiriendo a la segunda opción, ya que hablamos del archivo sitemap.xml que utilizan los buscadores para entender mas fácilmente la estructura del sitio.
Cabe destacar que aún existiendo este archivo (no es obligatorio) los buscadores también seguirán los links que tenga cada página.
El formato puede ser algo complicado, y puede verse mejor en http://www.sitemaps.org/protocol.php.
El resultado será algo como esto:
<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.google.com/schemas/sitemap/0.84"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/sitemap.xsd">
<url>
<loc>http://www.conexion-seo.com.mx/</loc>
<priority>1</priority>
</url>
<url>
<loc>http://www.conexion-seo.com.mx/index.php</loc>
<lastmod>2009-05-23</lastmod>
<priority>1</priority>
</url>
<url>
<loc>http://www.conexion-seo.com.mx/posts/alojamiento-web-mexico.php</loc>
<lastmod>2009-03-20</lastmod>
<priority>0.1</priority>
</url>
</urlset>
Prioridad del SiteMap.xml y PageRank
La prioridad (priority) no esta asociada con la importancia que el buscador le dará a la página destino, sino que es una forma de decirle al robot del buscador que páginas preferimos que indexe primero.
Es decir, si tenemos:
<url> <loc>http://www.conexion-seo.com.mx/en/web_site_design_and_development.php</loc> <lastmod>2009-01-04</lastmod> <priority>1</priority> </url> <url> <loc>http://www.conexion-seo.com.mx/posts/alojamiento-web-mexico.php</loc> <lastmod>2009-03-20</lastmod> <priority>0.1</priority> </url>
El buscador debería indexar <loc>http://www.../web_site_....php</loc> primero, y después <loc>http://www...posts/alojamiento...mexico.php</loc>. Pero la importancia o relevancia de la pagina será determinada por el buscador según su propio algoritmo, sin importar el valor que nosotros le demos.
Entonces, ¿para que sirve la prioridad? por los siguientes motivos:
- Los buscadores no necesariamente indexan el sitio completo
- Aún si indexan el sitio completo, puede ser que indexen una parte en un acceso y otra parte en uno o varios accesos posteriores.
Entonces, como se dijo mas arriba, estamos pidiendo al buscador que si va a indexar solo una parte, primero indexe la página con mayor prioridad y que deje la página de menor prioridad para un próximo acceso.
Herramientas de generación del SiteMap.xml
Para hacer nuestro propio SiteMap se necesita un editor de texto (como el notepad si utiliza Windows) y seguir el protocolo como se ve en el ejemplo.
Una forma más sencilla es utilizar una herramienta de generación de Sitemaps y luego editar manualmente lo que queremos cambiar.
Una buena herramienta gratuita para generación de sitemaps se puede encontrar en http://www.xml-sitemaps.com/
También hay un complemento para DreamWeaver creado por George Petrov en http://www.dmxzone.com/go?10538 que permite esta opción, aunque yo he tenido algunos problemas con algunos sitios (se colgaba)
El tamaño máximo del Sitemap es de 10Mb o 50,000 URL (lo que suceda primero). Si nuestro sitio excede estos límites, debemos crear varios Sitemaps y relacionarlos a través de un archivo de índice de Sitemaps.
Este tamaño máximo es antes de compresión, es decir, si superamos estos números no sirve comprimirlo, porque aún asi se considera que esta excedido en tamaña o cantidad de URL.
Del punto anterior se deduce que si puede comprimirse el Sitemap, y debe hacerse con la utilizad GZip para genera un sitemap.gz.


Comentarios
Agregar comentario