23/11/2022

Sitemaps XML. Cómo crear un mapa del sitio

Sitemaps - ¿Cómo crear un mapa del sitio?
Ayude a los motores de búsqueda a encontrar su sitio con
un sitemap XML

Sitemaps - ¿Cómo tener un mapa del sitio?

Última actualización: 23 de noviembre del 2022

Es importante crear y mantener al día un mapa del sitio para las mejores prácticas de SEO. Los motores de búsqueda pueden rastrear e indexar su sitio web más completo si tienen un mapa del sitio XML. Un Sitemap ayuda a recibir las arañas de los motores de búsqueda y ayudarles a rastrear e indexar todas las páginas web de su sitio.

    ¿Qué es un mapa del sitio?


    Un Sitemap XML es un archivo de texto que los webmasters crean para decirle a los motores de búsqueda como Google y Bing, las páginas web o url que un sitio web tiene. Se trata básicamente de una lista de todas las URL que se deben indexar - las URL de las páginas web, imágenes, vídeos y otros archivos de contenido en el sitio - formateados con algunas etiquetas XML. Los Sitemaps XML no deben confundirse con los mapas de sitio HTML, que son páginas web normales creadas para ayudar a los visitantes humanos a encontrar el contenido de un sitio web, por ejemplo,en la barra lateral izquierda tiene nuestro mapa del sitio para nuestros lectores. Sin embargo, cada uno tiene beneficios SEO, por lo que debe crear dos tipos XML y HTML para su sitio. 

    Aquí están las diferencias:
    Sitemaps XMLMapas de Sitio HTML
    Rastreable por los buscadores

    Leer por los visitantes humanos
    No
    Tamaño máximo50.000 URLs o 50 MB sin comprimir
    No se ha especificado, pero que sea fácil de usar

    Formato

    Archivo XML (texto plano)

    La página web (puede ser bastante)

    Vinculado desde
    Archivo robots.txtNavegación del sitio

    Recomendado para
     SEO




    ¿Por qué debería preocuparse por el mapa del sitio XML?


    Los Sitemaps XML ayudan a los motores de búsqueda a evaluar el contenido de su sitio web y es un mecanismo para notificarles sobre contenido nuevo o actualizado. Por lo tanto, se recomienda implementarlos siempre que sea factible. Y especialmente para sitios web más grandes (más de 500 páginas), se convierten en un verdadero imprescindible.

    ¿Qué aspecto tiene un mapa del sitio XML?


    Un mapa del sitio XML está destinado a los motores de búsqueda y, por lo tanto, están formateados en un lenguaje que es fácil de entender para las computadoras: XML. Afortunadamente, XML también es entendible para los humanos, así que echemos un vistazo a un ejemplo:

    <?xml version="1.0" encoding="UTF-8"?> 
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
    <url> 
        <loc>https://www.dominio.com/</loc>
        <lastmod>2017-06-14T19:55:25+02:00</lastmod> 
    </url>
    <url> 
        <loc>https://www.dominio.com/blog/</loc>
        <lastmod>2016-06-24T10:23:20+02:00</lastmod> 
    </url> 
    </urlset>

    Ahora explicaremos las partes del sitemap xml

    Encabezado XML

    <?xml version="1.0" encoding="UTF-8"?>

    Este encabezado indica que el contenido está estructurado de acuerdo con la versión 1.0 del estándar XML y describe la codificación de caracteres. Básicamente, informa a los motores de búsqueda lo que pueden esperar del archivo.

    Definición del conjunto de URL

    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

    Esta definición de urlset encapsula todas las URL contenidas en el mapa del sitio y describe qué versión del estándar del mapa del sitio XML se utiliza. Tenga en cuenta que el urlset se cierra en la parte inferior del documento:

    </urlset>

    Definición de las URL individuales
    <url> 
    <loc>https://www.dominio.com/</loc> 
    <lastmod>2017-06-14T19:55:25+02:00</lastmod> 
    </url>
    Finalmente llegamos a la parte más importante: la definición de las URL individuales a través de la  etiqueta url. Cada definición de URL debe contener al menos la locetiqueta, (abreviatura de ubicación). El valor de esta etiqueta debe ser la URL completa de la página, incluido el protocolo (por ejemplo, "http://").

    Además de eso, cada definición de URL puede contener las siguientes propiedades opcionales:

    • lastmod: la fecha de la última modificación del contenido de esa URL. La fecha está en "W3C datetime" formato.
    • priority: la prioridad de la URL, relativa a tu propio sitio web en una escala entre 0,0 y 1,0.
    • changefreq: con qué frecuencia se espera que cambie el contenido de la URL. Los valores posibles son siempre, cada hora, diario, semanal, mensual, anual y nunca.

    ¿Cuántos Sitemaps debo crear?


    A diferencia de la presentación de su sitio en forma manual, lo cual es una tarea completamente opcional, cada sitio debe tener por lo menos un Sitemap XML. Los grandes sitios web pueden necesitar varios para asegurar que el número de direcciones por no exceda el límite.

    También se recomienda (para un sitio web de cualquier tamaño) que ciertos tipos de archivos se mostrarán en su propio sitio especializado: vídeos y noticias, para los dos ejemplos. Por lo tanto, si tienes vídeos en su sitio, cree un sitemap especializado de vídeo para asegurarse que los motores de búsqueda van encontrar sus archivos de vídeo.

    En otro de sus muchos vídeos útiles para los webmasters, Matt Cutts de Google responde a la pregunta, "¿Qué es mejor: un mapa del sitio HTML o Mapa del sitio XML "

    Escucha como él explica que debido a que cumplen diferentes necesidades, ambos son importantes.



    ¿Dónde debo colocar mi Sitemap XML?


    Al igual que las páginas de su sitio web, el Sitemap XML reside en su propia URL. Por lo general, la URL de un mapa del sitio XML es / sitemap.xmly se recomienda seguir esta convención para que los motores de búsqueda puedan descubrirlo fácilmente.

    Sin embargo, si por alguna razón esto no es posible, puede elegir una ubicación o nombre de archivo diferente, siempre que haga referencia a él en su archivo robots.txt a través de la directiva Sitemap:

    Sitemap: http://www.ejemplo.com/alternativelocation/alternativefilename.xml

    Cómo crear un mapa del sitio XML


    Puede crear un sitemap de forma manual, ya quecómo hemosvisto el lenguaje XML es bastante comprensible, pero utilizando un generador de mapa del sitio hace que el trabajo sea más fácil. Hay muchas buenas herramientas de terceros para crear Sitemaps XML automáticamente. Uno es una tecnología del lado del servidor de código libre de Microsoft Bing Plugin Bing Mapa del Sitio XML, que puede generar automáticamente dos tipos de Sitemaps XML que pueden ser leídos por cualquier motor de búsqueda:
    Integral del sitio, que incluye todos los archivos (excepto alguno que no permita en su archivo robots.txt)

    Recién actualizados del sitio, que incluye las direcciones URL de sólo archivos modificados (útil para su seguimiento o para dar prioridad a las páginas que los buscadores deben rastrar.)

    NOTA: Cualquier motor de búsqueda puede leer los archivos XML Sitemap porque cumplen con el protocolo Sitemaps.org.
    Cómo enviar su sitio a los motores de búsqueda

    Usted puede enviar sus Sitemaps XML a Google y Bing utilizando su cuenta dentro de sus herramientas para webmasters:

    • Formatos de Sitemaps
    • Recursos para crear Sitemaps
    • Cómo enviarlo
    • Bing: Ingresar a Bing Webmaster Tools. Usted puede utilizar el widget del sitio en su panel o ir a la función de Sitemaps, ubicada en la sección Configuración de Mi sitio.


    Los métodos anteriores permiten proactivamente enviar su archivos de mapa del sitio XML a los motores de búsqueda. En cualquier caso, asegúrese de especificar la ubicación de su sitemap XML en el archivo robots.txt, donde las arañas están seguras de encontrarlo la próxima vez que vienen a rastrear.

    Un archivo robots.txt es simplemente un archivo de texto guardado en la raíz de tu sitio web y que da instrucciones para la visita de los motores de búsqueda. Su archivo robots.txt debe ser similar a las líneas siguientes (abajo), con una directiva por línea y una línea Sitemap para cada uno de sus diferentes Mapas del sitio XML:


    User-agent: * 
    Disallow: /tmp/ 
    Disallow: /nombre-de-archivo.html 
    Sitemap: http://sitio-web.com/mi-sitemap1.xml 
    Sitemap: http://sitio-web.com/mi-sitemap2.xml


    Se recomienda encarecidamente implementar un Sitemap XML, especialmente en sitios web más grandes (más de 500 páginas).


    ¿Hay alguna limitación para los Sitemaps XML?


    Los Sitemaps XML tienen un par de limitaciones a tener en cuenta:No deben contener más de un máximo de 50.000 URL.
    Su tamaño de archivo está limitado a 50 MB cuando no está comprimido.

    Si su mapa del sitio XML supera estos límites, debe dividirlos en varios mapas del sitio XML y utilizar un índice del mapa del sitio XML.

    Cumpla con las siguientes prácticas recomendadas al implementar un mapa del sitio XML:

    • Mantenga el Sitemap XML actualizado con el contenido de su sitio web. Asegúrese de que su Sitemap XML proporcione una imagen actualizada de su sitio web. Cada vez que se elimina una página, también debe eliminarse de su mapa del sitio XML. Si está utilizando la etiqueta opcional lastmod, asegúrese de actualizar la marca de tiempo cada vez que cambie la página.
    • Asegúrate de que esté limpio: solo se deben incluir páginas indexables. Su mapa del sitio XML solo debe describir páginas indexables. Esto significa que debe omitir todas las URL que apuntan a redireccionamientos (por ejemplo, código de estado 301) y páginas faltantes (por ejemplo, código de estado 404).

      Además, estas páginas deben ser indexables, lo que significa que son accesibles para los motores de búsqueda (sin exclusión en robots.txt) y no hay directivas que indiquen a los motores de búsqueda que no indexen la página (como meta robots, enlaces canónicos o la etiqueta x-robots).
    • Haga referencia al mapa del sitio XML de su archivo robots.txt. Cuando se desvía de la convención para la URL de su mapa de sitio XML o índice de mapa de sitio XML, debe hacer referencia a él en su archivo robots.txt. Sin embargo, incluso si se apega a la URL estándar, se recomienda incluir una referencia a ella en su archivo robots.txt para garantizar que los motores de búsqueda puedan detectarlo.
    • No enumere más de 50.000 URL en un solo mapa del sitio XML.
    • Asegúrese de que el tamaño del archivo (sin comprimir) no supere los 50 MB.

    El problema "Indexado, no enviado en el mapa del sitio" en el Informe de cobertura del índice de Google Search Console es muy útil para verificar si su mapa del sitio XML incluye todas sus páginas indexables.

    ¿Qué es un índice de mapa de sitio XML?


    Cada vez que supere las limitaciones de un solo mapa de sitio XML, debe dividirlos en mapas de sitio XML separados y agruparlos con un índice de mapa de sitio XML. Este índice es un archivo XML independiente que hace referencia a los distintos mapas de sitios XML.

    Ejemplo:

    <?xml version="1.0" encoding="UTF-8"?> 
    <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
        <sitemap> 
            <loc>http://www.ejemplo.com/sitemap1.xml.gz</loc> 
            <lastmod>2004-10-01T18:23:17+00:00</lastmod> 
        </sitemap> 
        <sitemap> 
            <loc>http://www.ejemplo.com/sitemap2.xml.gz</loc> 
            <lastmod>2005-01-01</lastmod> 
        </sitemap> 
    </sitemapindex>

    Este índice de mapas de sitios XML hace referencia a dos mapas de sitios XML: sitemap1.xml.gzy sitemap2.xml.gz.

    Lo explicamos de nuevo:

    Encabezado XML

    <?xml version="1.0" encoding="UTF-8"?>

    Aquí no hay nada nuevo, al igual que con el archivo XML Sitemap, primero definimos que el archivo está en formato XML y qué codificación de caracteres se utiliza.

    Definición del índice del mapa del sitio

    <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

    Ahora, en lugar de una definición de urlset , vemos una definición de sitemapindex . Esta definición encapsula todos los mapas del sitio contenidos en el índice del mapa del sitio y nuevamente qué versión del estándar XML Sitemap se utiliza. Al igual que la definición de urlset, la definición de sitemapindex se cierra en la parte inferior del documento:

    </sitemapindex>

    Definición de los sitemaps individuales
    <sitemap> 
        <loc>http://www.ejemplo.com/sitemap1.xml.gz</loc> 
        <lastmod>2004-10-01T18:23:17+00:00</lastmod> 
    </sitemap>

    Y luego la definición real de los mapas de sitio individuales. Al igual que con las URL, cada definición de mapa del sitio debe contener al menos la locetiqueta, que contiene la URL completa del mapa del sitio XML individual.

    Además de eso, la definición del mapa del sitio puede contener opcionalmente una definición de lastmod. La fecha en la que se actualizó por última vez el mapa del sitio XML al que se hace referencia. Nuevamente en "W3C datetime" formato.


    ¿Qué significa la extensión .gz?


    La extensión .gz se agrega al nombre del archivo cuando se comprime el mapa del sitio XML (a través de la compresión gzip). Los Sitemaps XML que contienen muchas URL generalmente crecen a tamaños de archivo significativos y, mediante el uso de la compresión, se puede reducir el impacto de esto en el almacenamiento en disco y el tiempo de transferencia en la red.

    Eso es todo! Una vez que crea sus Sitemaps XML y le dice a los motores de búsqueda dónde encontrarlos usando el archivo robots.txt, las arañas de los motores de búsqueda deben hacer el resto. Si necesita más información sobre cómo crear un mapa del sitio, vea la Ayuda de la cónsola de búsqueda de Google.

    Si necesita un buen mapa del sitio XML no  dude en contactarme.


    Contenido Relacionado:

    Herramienta para Encontrar Vínculos de Retroceso de sus Competidores
    Como Evitar el Filtro de Contenido Duplicado Google

    No hay comentarios: