Con Conexión-SEO hemos encontrado el apoyo técnico y humano mas importante, para el desarrollo de nuestros proyectos en las fechas previstas

Daniel Astuy, DiveMaster y propietario del Centro de Buceo en México BahiaDivers

Como crear un Google Sitemap.xml

Empecemos por decir que es un Sitemap.

Hay 2 elementos distintos a los que se les da este nombre:

  • Una página Web donde se muestra el contenido de nuestro sitio, separado por secciones, con links a cada pagina. Es para ser leido por los visitants (humanos)
  • Un archivo XML que contiene campos que pueden ser leidos por un buscador (crawler o robot) y que le permiten conocer la estructura del sitio Web que esta revisando.

En este caso nos estamos refiriendo a la segunda opción, ya que hablamos del archivo sitemap.xml que utilizan los buscadores para entender mas fácilmente la estructura del sitio.

Cabe destacar que aún existiendo este archivo (no es obligatorio) los buscadores también seguirán los links que tenga cada página.

El formato puede ser algo complicado, y puede verse mejor en http://www.sitemaps.org/protocol.php.

El resultado será algo como esto:

<?xml version="1.0"  encoding="UTF-8"?>
<urlset
      xmlns="http://www.google.com/schemas/sitemap/0.84"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84
      http://www.google.com/schemas/sitemap/0.84/sitemap.xsd">  
  <url>
  <loc>http://www.conexion-seo.com.mx/</loc>
  <priority>1</priority>
  </url>
  <url>
  <loc>http://www.conexion-seo.com.mx/index.php</loc>
  <lastmod>2009-05-23</lastmod>
  <priority>1</priority>
  </url>
  <url>
  <loc>http://www.conexion-seo.com.mx/posts/alojamiento-web-mexico.php</loc>
  <lastmod>2009-03-20</lastmod>
  <priority>0.1</priority>
  </url>
</urlset>

Prioridad del SiteMap.xml y PageRank

La prioridad (priority) no esta asociada con la importancia que el buscador le dará a la página destino, sino que es una forma de decirle al robot del buscador que páginas preferimos que indexe primero.
Es decir, si tenemos:

<url>
	<loc>http://www.conexion-seo.com.mx/en/web_site_design_and_development.php</loc>
	<lastmod>2009-01-04</lastmod>
	<priority>1</priority>
</url>
<url>
	<loc>http://www.conexion-seo.com.mx/posts/alojamiento-web-mexico.php</loc>
 	<lastmod>2009-03-20</lastmod>
	<priority>0.1</priority>
</url>

El buscador debería indexar     <loc>http://www.../web_site_....php</loc> primero, y después     <loc>http://www...posts/alojamiento...mexico.php</loc>. Pero la importancia o relevancia de la pagina será determinada por el buscador según su propio algoritmo, sin importar el valor que nosotros le demos.

Entonces, ¿para que sirve la prioridad? por los siguientes motivos:

  • Los buscadores no necesariamente indexan el sitio completo
  • Aún si indexan el sitio completo, puede ser que indexen una parte en un acceso y otra parte en uno o varios accesos posteriores.

Entonces, como se dijo mas arriba, estamos pidiendo al buscador que si va a indexar solo una parte, primero indexe la página con mayor prioridad y que deje la página de menor prioridad para un próximo acceso.

Herramientas de generación del SiteMap.xml

Para hacer nuestro propio SiteMap se necesita un editor de texto (como el notepad si utiliza Windows) y seguir el protocolo como se ve en el ejemplo.

Una forma más sencilla es utilizar una herramienta de generación de Sitemaps y luego editar manualmente lo que queremos cambiar.

Una buena herramienta gratuita para generación de sitemaps se puede encontrar en http://www.xml-sitemaps.com/

También hay un complemento para DreamWeaver creado por George Petrov en http://www.dmxzone.com/go?10538 que permite esta opción, aunque yo he tenido algunos problemas con algunos sitios (se colgaba)

El tamaño máximo del Sitemap es de 10Mb o 50,000 URL (lo que suceda primero). Si nuestro sitio excede estos límites, debemos crear varios Sitemaps y relacionarlos a través de un archivo de índice de Sitemaps.

Este tamaño máximo es antes de compresión, es decir, si superamos estos números no sirve comprimirlo, porque aún asi se considera que esta excedido en tamaña o cantidad de URL.

Del punto anterior se deduce que si puede comprimirse el Sitemap, y debe hacerse con la utilizad GZip para genera un sitemap.gz.

Comentarios

Agregar comentario

El contenido de este campo no sera publicado y solo se utiliza internamente como control.
  • Se generan automáticamente los vinculos de direcciones Web y de correo electrónico
  • Tags HTML permitidos: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Los saltos de linea y párrafo se generan automáticamente
  • Add tooltips to text. Usage [tip:Text to highlight=The tooltip's content]

More information about formatting options

CAPTCHA
Esta confirmación nos ayuda a disminuir los comentarios automatizados y el SPAM.