GET_URLS_FROM_SITEMAP
Extrair todas as URLs de um sitemap XML, lida com índices de sitemap recursivamente
=GET_URLS_FROM_SITEMAP(sitemapUrl)Retorna: string[][]
Visão Geral
GET_URLS_FROM_SITEMAP busca e analisa um sitemap XML, extraindo cada URL listada dentro dele e retornando-as como uma lista vertical na sua planilha do Google. Esta função é uma pedra angular de qualquer fluxo de trabalho de SEO técnico, permitindo que você rapidamente inventarie todas as páginas que um site submeteu aos mecanismos de busca para indexação.
Parâmetros
| Parâmetro | Tipo | Obrigatório | Descrição |
|---|---|---|---|
sitemapUrl | string | Sim | A URL completa para um sitemap XML ou arquivo de índice de sitemap |
Exemplos
Extrair URLs de um sitemap padrão
Busca o sitemap e retorna todas as URLs como uma lista vertical começando da célula onde a fórmula foi inserida.
=GET_URLS_FROM_SITEMAP("https://example.com/sitemap.xml")Saída
| https://example.com/ |
| https://example.com/about |
| https://example.com/contact |
| https://example.com/blog |
Analisar um índice de sitemap com múltiplos sitemaps
Detecta automaticamente o índice de sitemap, segue cada sitemap filho e retorna todas as URLs de cada sitemap combinadas.
=GET_URLS_FROM_SITEMAP("https://example.com/sitemap_index.xml")Saída
| https://example.com/ |
| https://example.com/products/widget-a |
| https://example.com/products/widget-b |
| https://example.com/blog/post-1 |
Extrair de um sub-sitemap específico
Direciona para um arquivo de sitemap específico (ex., apenas posts de blog) para obter uma lista focada de URLs para um tipo particular de conteúdo.
=GET_URLS_FROM_SITEMAP("https://example.com/post-sitemap.xml")Saída
| https://example.com/blog/seo-guide |
| https://example.com/blog/keyword-research |
| https://example.com/blog/link-building |
Casos de Uso
Inventário Completo do Site
Extraia cada URL indexada de um site de cliente antes de começar uma auditoria. Faça referência cruzada com dados do Google Search Console para encontrar páginas que estão indexadas mas não no sitemap, ou no sitemap mas não indexadas.
Auditoria e Poda de Conteúdo
Extraia todas as URLs de artigos de um sitemap de notícias para avaliar o desempenho do conteúdo, identificar páginas fracas ou desatualizadas para poda e priorizar esforços de atualização de conteúdo.
Análise de Conteúdo de Concorrentes
Analise um sitemap de concorrente para entender sua estrutura de site, volume de conteúdo e padrões de URL. Descubra lacunas de conteúdo e oportunidades comparando suas páginas com as suas.
Pré-verificação de Migração
Antes de migrar um site, extraia todas as URLs do sitemap atual para criar uma planilha de mapeamento de redirecionamentos, garantindo que cada página existente tenha um destino correspondente no novo site.
Monitoramento de Catálogo de E-commerce
Extraia regularmente URLs de produtos do sitemap para monitorar o tamanho do catálogo, detectar produtos removidos acidentalmente e garantir que todos os novos produtos estejam corretamente incluídos no sitemap.
Verificação de Cobertura de SEO Internacional
Analise sitemaps para cada versão de idioma de um site para verificar se todas as páginas foram traduzidas e incluídas, identificando páginas faltantes em diferentes locales.
Dicas Profissionais
Depois de extrair URLs, use GET_STATUS_CODE em cada uma para criar um relatório completo de saúde do site que identifique páginas quebradas, cadeias de redirecionamento e erros de servidor.
Combine com SCRAPE para extrair a tag de título e meta descrição de cada URL, construindo uma planilha completa de auditoria de SEO on-page.
Use fórmulas COUNTIF nas URLs extraídas para analisar sua estrutura de site. Conte URLs por diretório (ex., /blog/, /products/) para entender a distribuição de conteúdo.
Compare extrações de sitemap ao longo do tempo para rastrear como seu site está crescendo e detectar quaisquer páginas que foram acidentalmente removidas do sitemap.
Verifique os sitemaps de seus concorrentes para descobrir sua estratégia de conteúdo e encontrar oportunidades de tópicos que você pode estar perdendo.
Uma das características mais poderosas desta função é sua capacidade de lidar com arquivos de índice de sitemap recursivamente. Muitos sites grandes dividem seus sitemaps em múltiplos arquivos referenciados por um único índice de sitemap. Quando você fornece uma URL de índice de sitemap, a função automaticamente detecta, segue cada sitemap referenciado e extrai URLs de todos eles, retornando uma lista completa sem nenhum esforço manual.
Esta função combina excepcionalmente bem com outras funções do Unlimited Sheets. Uma vez que você extraiu a lista completa de URLs, pode usar GET_STATUS_CODE para auditar cada página em busca de erros, SCRAPE para extrair elementos de SEO on-page como títulos e meta descrições, ou GET_SEARCH_VOLUME_FROM_GOOGLE para pesquisar palavras-chave relacionadas a cada página. Isso torna possível construir auditorias de SEO completas inteiramente dentro do Google Sheets.
A função suporta sitemaps XML padrão em conformidade com o protocolo sitemaps.org, incluindo índices de sitemap, sitemaps regulares e sitemaps de notícias. Lida com sitemaps comprimidos (gzip) quando o servidor fornece codificação de conteúdo adequada. Para sites com dezenas de milhares de URLs, os resultados são retornados progressivamente conforme os sitemaps são analisados.
Erros Comuns
#ERROR!Causa: A URL não aponta para um sitemap XML válido, ou o servidor bloqueou a requisição.
Correção: Verifique se a URL leva a um sitemap XML válido abrindo-a no seu navegador. Certifique-se de que a URL termina em .xml e que o servidor responde com conteúdo XML.
#VALUE!Causa: A URL fornecida não está corretamente formatada ou está faltando o protocolo.
Correção: Certifique-se de que a URL inclui "https://" ou "http://" e é uma URL completa e válida apontando para o arquivo de sitemap.
Perguntas Frequentes
Sim, a função detecta automaticamente arquivos de índice de sitemap e busca recursivamente todos os sitemaps filhos, retornando uma lista combinada de cada URL encontrada em todos os sitemaps.
A função pode lidar com sitemaps de qualquer tamanho. No entanto, o Google Sheets tem um limite de células, então sitemaps extremamente grandes (mais de 100.000 URLs) podem precisar ser processados em segmentos ou exportados para uma planilha separada.
Sim, você pode extrair URLs de qualquer sitemap publicamente acessível. A maioria dos sites torna seus sitemaps publicamente disponíveis em /sitemap.xml ou os referencia em seu arquivo robots.txt.
Se não existir um sitemap na URL especificada, a função retornará um erro. Tente verificar o arquivo robots.txt do site (geralmente em /robots.txt) para a localização do sitemap, ou procure por caminhos comuns como /sitemap.xml, /sitemap_index.xml ou /sitemap/
A função foca em extrair a lista de URLs para máxima simplicidade e usabilidade. As URLs retornadas são os valores <loc> do XML do sitemap.
A maioria dos sites coloca seu sitemap em /sitemap.xml. Você também pode verificar o arquivo robots.txt (ex., https://example.com/robots.txt) que frequentemente contém uma diretiva Sitemap: apontando para a localização do sitemap.
Sim, a função pode lidar com sitemaps comprimidos com gzip (.xml.gz) desde que o servidor forneça cabeçalhos de codificação de conteúdo adequados.
Funções Relacionadas
Comece a usar GET_URLS_FROM_SITEMAP hoje
Instale o Unlimited Sheets para obter GET_URLS_FROM_SITEMAP e outras 41 funções poderosas no Google Sheets.