🔍 SEO ToolsFree Plano

GET_URLS_FROM_SITEMAP

Extrair todas as URLs de um sitemap XML, lida com índices de sitemap recursivamente

Assinatura da Fórmula
=GET_URLS_FROM_SITEMAP(sitemapUrl)

Retorna: string[][]

Visão Geral

GET_URLS_FROM_SITEMAP busca e analisa um sitemap XML, extraindo cada URL listada dentro dele e retornando-as como uma lista vertical na sua planilha do Google. Esta função é uma pedra angular de qualquer fluxo de trabalho de SEO técnico, permitindo que você rapidamente inventarie todas as páginas que um site submeteu aos mecanismos de busca para indexação.

Parâmetros

ParâmetroTipoObrigatórioDescrição
sitemapUrlstringSimA URL completa para um sitemap XML ou arquivo de índice de sitemap

Exemplos

1

Extrair URLs de um sitemap padrão

Busca o sitemap e retorna todas as URLs como uma lista vertical começando da célula onde a fórmula foi inserida.

fx
=GET_URLS_FROM_SITEMAP("https://example.com/sitemap.xml")

Saída

https://example.com/
https://example.com/about
https://example.com/contact
https://example.com/blog
2

Analisar um índice de sitemap com múltiplos sitemaps

Detecta automaticamente o índice de sitemap, segue cada sitemap filho e retorna todas as URLs de cada sitemap combinadas.

fx
=GET_URLS_FROM_SITEMAP("https://example.com/sitemap_index.xml")

Saída

https://example.com/
https://example.com/products/widget-a
https://example.com/products/widget-b
https://example.com/blog/post-1
3

Extrair de um sub-sitemap específico

Direciona para um arquivo de sitemap específico (ex., apenas posts de blog) para obter uma lista focada de URLs para um tipo particular de conteúdo.

fx
=GET_URLS_FROM_SITEMAP("https://example.com/post-sitemap.xml")

Saída

https://example.com/blog/seo-guide
https://example.com/blog/keyword-research
https://example.com/blog/link-building

Casos de Uso

Agência de SEO

Inventário Completo do Site

Extraia cada URL indexada de um site de cliente antes de começar uma auditoria. Faça referência cruzada com dados do Google Search Console para encontrar páginas que estão indexadas mas não no sitemap, ou no sitemap mas não indexadas.

Publicação

Auditoria e Poda de Conteúdo

Extraia todas as URLs de artigos de um sitemap de notícias para avaliar o desempenho do conteúdo, identificar páginas fracas ou desatualizadas para poda e priorizar esforços de atualização de conteúdo.

Marketing Digital

Análise de Conteúdo de Concorrentes

Analise um sitemap de concorrente para entender sua estrutura de site, volume de conteúdo e padrões de URL. Descubra lacunas de conteúdo e oportunidades comparando suas páginas com as suas.

Desenvolvimento Web

Pré-verificação de Migração

Antes de migrar um site, extraia todas as URLs do sitemap atual para criar uma planilha de mapeamento de redirecionamentos, garantindo que cada página existente tenha um destino correspondente no novo site.

E-commerce

Monitoramento de Catálogo de E-commerce

Extraia regularmente URLs de produtos do sitemap para monitorar o tamanho do catálogo, detectar produtos removidos acidentalmente e garantir que todos os novos produtos estejam corretamente incluídos no sitemap.

SaaS

Verificação de Cobertura de SEO Internacional

Analise sitemaps para cada versão de idioma de um site para verificar se todas as páginas foram traduzidas e incluídas, identificando páginas faltantes em diferentes locales.

Dicas Profissionais

DICA

Depois de extrair URLs, use GET_STATUS_CODE em cada uma para criar um relatório completo de saúde do site que identifique páginas quebradas, cadeias de redirecionamento e erros de servidor.

DICA

Combine com SCRAPE para extrair a tag de título e meta descrição de cada URL, construindo uma planilha completa de auditoria de SEO on-page.

DICA

Use fórmulas COUNTIF nas URLs extraídas para analisar sua estrutura de site. Conte URLs por diretório (ex., /blog/, /products/) para entender a distribuição de conteúdo.

DICA

Compare extrações de sitemap ao longo do tempo para rastrear como seu site está crescendo e detectar quaisquer páginas que foram acidentalmente removidas do sitemap.

DICA

Verifique os sitemaps de seus concorrentes para descobrir sua estratégia de conteúdo e encontrar oportunidades de tópicos que você pode estar perdendo.

Uma das características mais poderosas desta função é sua capacidade de lidar com arquivos de índice de sitemap recursivamente. Muitos sites grandes dividem seus sitemaps em múltiplos arquivos referenciados por um único índice de sitemap. Quando você fornece uma URL de índice de sitemap, a função automaticamente detecta, segue cada sitemap referenciado e extrai URLs de todos eles, retornando uma lista completa sem nenhum esforço manual.

Esta função combina excepcionalmente bem com outras funções do Unlimited Sheets. Uma vez que você extraiu a lista completa de URLs, pode usar GET_STATUS_CODE para auditar cada página em busca de erros, SCRAPE para extrair elementos de SEO on-page como títulos e meta descrições, ou GET_SEARCH_VOLUME_FROM_GOOGLE para pesquisar palavras-chave relacionadas a cada página. Isso torna possível construir auditorias de SEO completas inteiramente dentro do Google Sheets.

A função suporta sitemaps XML padrão em conformidade com o protocolo sitemaps.org, incluindo índices de sitemap, sitemaps regulares e sitemaps de notícias. Lida com sitemaps comprimidos (gzip) quando o servidor fornece codificação de conteúdo adequada. Para sites com dezenas de milhares de URLs, os resultados são retornados progressivamente conforme os sitemaps são analisados.

Erros Comuns

#ERROR!

Causa: A URL não aponta para um sitemap XML válido, ou o servidor bloqueou a requisição.

Correção: Verifique se a URL leva a um sitemap XML válido abrindo-a no seu navegador. Certifique-se de que a URL termina em .xml e que o servidor responde com conteúdo XML.

#VALUE!

Causa: A URL fornecida não está corretamente formatada ou está faltando o protocolo.

Correção: Certifique-se de que a URL inclui "https://" ou "http://" e é uma URL completa e válida apontando para o arquivo de sitemap.

Perguntas Frequentes

Sim, a função detecta automaticamente arquivos de índice de sitemap e busca recursivamente todos os sitemaps filhos, retornando uma lista combinada de cada URL encontrada em todos os sitemaps.

A função pode lidar com sitemaps de qualquer tamanho. No entanto, o Google Sheets tem um limite de células, então sitemaps extremamente grandes (mais de 100.000 URLs) podem precisar ser processados em segmentos ou exportados para uma planilha separada.

Sim, você pode extrair URLs de qualquer sitemap publicamente acessível. A maioria dos sites torna seus sitemaps publicamente disponíveis em /sitemap.xml ou os referencia em seu arquivo robots.txt.

Se não existir um sitemap na URL especificada, a função retornará um erro. Tente verificar o arquivo robots.txt do site (geralmente em /robots.txt) para a localização do sitemap, ou procure por caminhos comuns como /sitemap.xml, /sitemap_index.xml ou /sitemap/

A função foca em extrair a lista de URLs para máxima simplicidade e usabilidade. As URLs retornadas são os valores <loc> do XML do sitemap.

A maioria dos sites coloca seu sitemap em /sitemap.xml. Você também pode verificar o arquivo robots.txt (ex., https://example.com/robots.txt) que frequentemente contém uma diretiva Sitemap: apontando para a localização do sitemap.

Sim, a função pode lidar com sitemaps comprimidos com gzip (.xml.gz) desde que o servidor forneça cabeçalhos de codificação de conteúdo adequados.

Funções Relacionadas

Comece a usar GET_URLS_FROM_SITEMAP hoje

Instale o Unlimited Sheets para obter GET_URLS_FROM_SITEMAP e outras 41 funções poderosas no Google Sheets.