🔍 SEO ToolsFree Plan

GET_URLS_FROM_SITEMAP

Extraer todas las URLs de un sitemap XML, maneja índices de sitemap recursivamente

Firma de la Fórmula
=GET_URLS_FROM_SITEMAP(sitemapUrl)

Devuelve: string[][]

Descripción General

GET_URLS_FROM_SITEMAP obtiene y analiza un sitemap XML, extrayendo cada URL listada dentro de él y devolviéndolas como una lista vertical en tu Google Sheet. Esta función es una piedra angular de cualquier flujo de trabajo de SEO técnico, permitiéndote inventariar rápidamente todas las páginas que un sitio web ha enviado a los motores de búsqueda para indexación.

Parámetros

ParámetroTipoRequeridoDescripción
sitemapUrlstringLa URL completa a un sitemap XML o archivo de índice de sitemap

Ejemplos

1

Extraer URLs de un sitemap estándar

Obtiene el sitemap y devuelve todas las URLs como una lista vertical comenzando desde la celda donde se ingresó la fórmula.

fx
=GET_URLS_FROM_SITEMAP("https://example.com/sitemap.xml")

Salida

https://example.com/
https://example.com/about
https://example.com/contact
https://example.com/blog
2

Analizar un índice de sitemap con múltiples sitemaps

Detecta automáticamente el índice de sitemap, sigue cada sitemap hijo, y devuelve todas las URLs de cada sitemap combinadas.

fx
=GET_URLS_FROM_SITEMAP("https://example.com/sitemap_index.xml")

Salida

https://example.com/
https://example.com/products/widget-a
https://example.com/products/widget-b
https://example.com/blog/post-1
3

Extraer de un sub-sitemap específico

Apunta a un archivo de sitemap específico (ej., solo publicaciones de blog) para obtener una lista enfocada de URLs para un tipo particular de contenido.

fx
=GET_URLS_FROM_SITEMAP("https://example.com/post-sitemap.xml")

Salida

https://example.com/blog/seo-guide
https://example.com/blog/keyword-research
https://example.com/blog/link-building

Casos de Uso

Agencia SEO

Inventario Completo del Sitio

Extrae cada URL indexada de un sitio cliente antes de comenzar una auditoría. Cruza referencias con datos de Google Search Console para encontrar páginas que están indexadas pero no en el sitemap, o en el sitemap pero no indexadas.

Editorial

Auditoría y Poda de Contenido

Extrae todas las URLs de artículos de un sitemap de noticias para evaluar el rendimiento del contenido, identificar páginas delgadas o desactualizadas para podar, y priorizar esfuerzos de actualización de contenido.

Marketing Digital

Análisis de Contenido de Competidores

Analiza un sitemap de competidor para entender su estructura de sitio, volumen de contenido y patrones de URL. Descubre brechas de contenido y oportunidades comparando sus páginas contra las tuyas.

Desarrollo Web

Pre-verificación de Migración

Antes de migrar un sitio, extrae todas las URLs del sitemap actual para crear una hoja de cálculo de mapeo de redirecciones, asegurando que cada página existente tenga un destino correspondiente en el nuevo sitio.

E-commerce

Monitoreo de Catálogo de E-commerce

Extrae regularmente URLs de productos del sitemap para monitorear el tamaño del catálogo, detectar productos eliminados accidentalmente, y asegurar que todos los nuevos productos estén correctamente incluidos en el sitemap.

SaaS

Verificación de Cobertura SEO Internacional

Analiza sitemaps para cada versión de idioma de un sitio web para verificar que todas las páginas hayan sido traducidas e incluidas, identificando páginas faltantes en diferentes locales.

Consejos Profesionales

CONSEJO

Después de extraer URLs, usa GET_STATUS_CODE en cada una para crear un informe completo de salud del sitio que identifique páginas rotas, cadenas de redirección y errores del servidor.

CONSEJO

Combina con SCRAPE para extraer la etiqueta de título y meta descripción de cada URL, construyendo una hoja de cálculo completa de auditoría SEO on-page.

CONSEJO

Usa fórmulas COUNTIF en las URLs extraídas para analizar tu estructura de sitio. Cuenta URLs por directorio (ej., /blog/, /products/) para entender la distribución de contenido.

CONSEJO

Compara extracciones de sitemap a lo largo del tiempo para rastrear cómo tu sitio está creciendo y detectar cualquier página que fue accidentalmente eliminada del sitemap.

CONSEJO

Verifica los sitemaps de tus competidores para descubrir su estrategia de contenido y encontrar oportunidades de temas que podrías estar perdiendo.

Una de las características más poderosas de esta función es su capacidad para manejar archivos de índice de sitemap recursivamente. Muchos sitios web grandes dividen sus sitemaps en múltiples archivos referenciados por un único índice de sitemap. Cuando proporcionas una URL de índice de sitemap, la función automáticamente lo detecta, sigue cada sitemap referenciado, y extrae URLs de todos ellos, devolviendo una lista completa sin ningún esfuerzo manual.

Esta función se combina excepcionalmente bien con otras funciones de Unlimited Sheets. Una vez que hayas extraído la lista completa de URLs, puedes usar GET_STATUS_CODE para auditar cada página en busca de errores, SCRAPE para extraer elementos SEO on-page como títulos y meta descripciones, o GET_SEARCH_VOLUME_FROM_GOOGLE para investigar palabras clave relacionadas con cada página. Esto hace posible construir auditorías SEO completas enteramente dentro de Google Sheets.

La función soporta sitemaps XML estándar conformes al protocolo sitemaps.org, incluyendo índices de sitemap, sitemaps regulares y sitemaps de noticias. Maneja sitemaps comprimidos (gzip) cuando el servidor proporciona codificación de contenido adecuada. Para sitios web con decenas de miles de URLs, los resultados se devuelven progresivamente a medida que se analizan los sitemaps.

Errores Comunes

#ERROR!

Causa: La URL no apunta a un sitemap XML válido, o el servidor bloqueó la solicitud.

Solución: Verifica que la URL lleve a un sitemap XML válido abriéndola en tu navegador. Asegúrate de que la URL termine en .xml y que el servidor responda con contenido XML.

#VALUE!

Causa: La URL proporcionada no está correctamente formateada o le falta el protocolo.

Solución: Asegúrate de que la URL incluya "https://" o "http://" y sea una URL completa y válida que apunte al archivo de sitemap.

Preguntas Frecuentes

Sí, la función detecta automáticamente archivos de índice de sitemap y obtiene recursivamente todos los sitemaps hijos, devolviendo una lista combinada de cada URL encontrada en todos los sitemaps.

La función puede manejar sitemaps de cualquier tamaño. Sin embargo, Google Sheets tiene un límite de celdas, por lo que sitemaps extremadamente grandes (más de 100,000 URLs) pueden necesitar ser procesados en segmentos o exportados a una hoja separada.

Sí, puedes extraer URLs de cualquier sitemap públicamente accesible. La mayoría de los sitios web hacen sus sitemaps públicamente disponibles en /sitemap.xml o los referencian en su archivo robots.txt.

Si no existe un sitemap en la URL especificada, la función devolverá un error. Intenta verificar el archivo robots.txt del sitio (usualmente en /robots.txt) para la ubicación del sitemap, o busca rutas comunes como /sitemap.xml, /sitemap_index.xml, o /sitemap/

La función se enfoca en extraer la lista de URLs para máxima simplicidad y usabilidad. Las URLs devueltas son los valores <loc> del XML del sitemap.

La mayoría de los sitios web colocan su sitemap en /sitemap.xml. También puedes verificar el archivo robots.txt (ej., https://example.com/robots.txt) que a menudo contiene una directiva Sitemap: apuntando a la ubicación del sitemap.

Sí, la función puede manejar sitemaps comprimidos con gzip (.xml.gz) siempre que el servidor proporcione encabezados de codificación de contenido adecuados.

Funciones Relacionadas

Comienza a usar GET_URLS_FROM_SITEMAP hoy

Instala Unlimited Sheets para obtener GET_URLS_FROM_SITEMAP y 41 otras funciones poderosas en Google Sheets.