🔍 SEO ToolsFree Plan

GET_URLS_FROM_SITEMAP

Alle URLs aus einer XML-Sitemap extrahieren, behandelt Sitemap-Indizes rekursiv

Formelsignatur
=GET_URLS_FROM_SITEMAP(sitemapUrl)

Gibt zurück: string[][]

Übersicht

GET_URLS_FROM_SITEMAP ruft eine XML-Sitemap ab und analysiert sie, wobei jede darin aufgeführte URL extrahiert und als vertikale Liste in Ihrem Google Sheet zurückgegeben wird. Diese Funktion ist ein Eckpfeiler jedes technischen SEO-Workflows und ermöglicht es Ihnen, schnell alle Seiten zu inventarisieren, die eine Website zur Indexierung an Suchmaschinen übermittelt hat.

Parameter

ParameterTypErforderlichBeschreibung
sitemapUrlstringJaDie vollständige URL zu einer XML-Sitemap oder Sitemap-Index-Datei

Beispiele

1

URLs aus einer Standard-Sitemap extrahieren

Ruft die Sitemap ab und gibt alle URLs als vertikale Liste zurück, beginnend von der Zelle, in der die Formel eingegeben wurde.

fx
=GET_URLS_FROM_SITEMAP("https://example.com/sitemap.xml")

Ausgabe

https://example.com/
https://example.com/about
https://example.com/contact
https://example.com/blog
2

Einen Sitemap-Index mit mehreren Sitemaps parsen

Erkennt automatisch den Sitemap-Index, folgt jeder untergeordneten Sitemap und gibt alle URLs aus allen kombinierten Sitemaps zurück.

fx
=GET_URLS_FROM_SITEMAP("https://example.com/sitemap_index.xml")

Ausgabe

https://example.com/
https://example.com/products/widget-a
https://example.com/products/widget-b
https://example.com/blog/post-1
3

Aus einer bestimmten Unter-Sitemap extrahieren

Zielt auf eine spezifische Sitemap-Datei (z.B. nur Blog-Posts), um eine fokussierte Liste von URLs für einen bestimmten Content-Typ zu erhalten.

fx
=GET_URLS_FROM_SITEMAP("https://example.com/post-sitemap.xml")

Ausgabe

https://example.com/blog/seo-guide
https://example.com/blog/keyword-research
https://example.com/blog/link-building

Anwendungsfälle

SEO-Agentur

Vollständiges Website-Inventar

Ziehen Sie vor Beginn eines Audits jede indexierte URL von einer Kunden-Website. Vergleichen Sie mit Google Search Console-Daten, um Seiten zu finden, die indexiert sind, aber nicht in der Sitemap stehen, oder in der Sitemap sind, aber nicht indexiert.

Verlagswesen

Content-Audit und -Bereinigung

Extrahieren Sie alle Artikel-URLs aus einer News-Sitemap, um die Content-Performance zu bewerten, dünne oder veraltete Seiten zur Bereinigung zu identifizieren und Content-Refresh-Bemühungen zu priorisieren.

Digital Marketing

Konkurrenten-Content-Analyse

Analysieren Sie eine Konkurrenten-Sitemap, um deren Website-Struktur, Content-Volumen und URL-Muster zu verstehen. Entdecken Sie Content-Lücken und Chancen, indem Sie deren Seiten mit Ihren vergleichen.

Webentwicklung

Migrations-Vorabprüfung

Extrahieren Sie vor einer Website-Migration alle URLs aus der aktuellen Sitemap, um eine Redirect-Mapping-Tabelle zu erstellen und sicherzustellen, dass jede bestehende Seite ein entsprechendes Ziel auf der neuen Website hat.

E-Commerce

E-Commerce-Katalog-Überwachung

Extrahieren Sie regelmäßig Produkt-URLs aus der Sitemap, um die Kataloggröße zu überwachen, versehentlich entfernte Produkte zu erkennen und sicherzustellen, dass alle neuen Produkte ordnungsgemäß in die Sitemap aufgenommen wurden.

SaaS

Internationales SEO-Abdeckungsprüfung

Parsen Sie Sitemaps für jede Sprachversion einer Website, um zu überprüfen, dass alle Seiten übersetzt und eingefügt wurden, und identifizieren Sie fehlende Seiten in verschiedenen Lokalisierungen.

Profi-Tipps

TIPP

Verwenden Sie nach dem Extrahieren von URLs GET_STATUS_CODE für jede einzelne, um einen umfassenden Website-Gesundheitsbericht zu erstellen, der defekte Seiten, Weiterleitungsketten und Serverfehler identifiziert.

TIPP

Kombinieren Sie mit SCRAPE, um den Title-Tag und die Meta-Beschreibung von jeder URL zu extrahieren und so eine vollständige On-Page-SEO-Audit-Tabelle zu erstellen.

TIPP

Verwenden Sie COUNTIF-Formeln auf den extrahierten URLs, um Ihre Website-Struktur zu analysieren. Zählen Sie URLs nach Verzeichnis (z.B. /blog/, /products/), um die Content-Verteilung zu verstehen.

TIPP

Vergleichen Sie Sitemap-Extraktionen im Zeitverlauf, um zu verfolgen, wie Ihre Website wächst, und um zu erkennen, ob Seiten versehentlich aus der Sitemap entfernt wurden.

TIPP

Überprüfen Sie die Sitemaps Ihrer Konkurrenten, um deren Content-Strategie zu entdecken und Themen-Chancen zu finden, die Ihnen möglicherweise entgehen.

Eine der leistungsfähigsten Funktionen dieser Funktion ist ihre Fähigkeit, Sitemap-Index-Dateien rekursiv zu verarbeiten. Viele große Websites teilen ihre Sitemaps in mehrere Dateien auf, die von einem einzigen Sitemap-Index referenziert werden. Wenn Sie eine Sitemap-Index-URL angeben, erkennt die Funktion dies automatisch, folgt jeder referenzierten Sitemap und extrahiert URLs aus allen, wobei eine vollständige Liste ohne manuellen Aufwand zurückgegeben wird.

Diese Funktion harmoniert außergewöhnlich gut mit anderen Unlimited Sheets-Funktionen. Sobald Sie die vollständige URL-Liste extrahiert haben, können Sie GET_STATUS_CODE verwenden, um jede Seite auf Fehler zu überprüfen, SCRAPE, um On-Page-SEO-Elemente wie Titel und Meta-Beschreibungen zu extrahieren, oder GET_SEARCH_VOLUME_FROM_GOOGLE, um Keywords zu jeder Seite zu recherchieren. Dies macht es möglich, umfassende SEO-Audits vollständig innerhalb von Google Sheets zu erstellen.

Die Funktion unterstützt Standard-XML-Sitemaps, die dem sitemaps.org-Protokoll entsprechen, einschließlich Sitemap-Indizes, regulärer Sitemaps und News-Sitemaps. Sie verarbeitet komprimierte (gzip) Sitemaps, wenn der Server die richtige Content-Kodierung bereitstellt. Bei Websites mit Zehntausenden von URLs werden die Ergebnisse progressiv zurückgegeben, während die Sitemaps geparst werden.

Häufige Fehler

#ERROR!

Ursache: Die URL verweist nicht auf eine gültige XML-Sitemap, oder der Server hat die Anfrage blockiert.

Lösung: Überprüfen Sie, dass die URL zu einer gültigen XML-Sitemap führt, indem Sie sie in Ihrem Browser öffnen. Stellen Sie sicher, dass die URL auf .xml endet und der Server mit XML-Inhalt antwortet.

#VALUE!

Ursache: Die angegebene URL ist nicht richtig formatiert oder das Protokoll fehlt.

Lösung: Stellen Sie sicher, dass die URL "https://" oder "http://" enthält und eine vollständige, gültige URL ist, die auf die Sitemap-Datei zeigt.

Häufig Gestellte Fragen

Ja, die Funktion erkennt automatisch Sitemap-Index-Dateien und ruft rekursiv alle untergeordneten Sitemaps ab, wobei eine kombinierte Liste aller URLs zurückgegeben wird, die in allen Sitemaps gefunden wurden.

Die Funktion kann Sitemaps jeder Größe verarbeiten. Google Sheets hat jedoch ein Zellenlimit, sodass extrem große Sitemaps (über 100.000 URLs) möglicherweise in Segmenten verarbeitet oder in ein separates Sheet exportiert werden müssen.

Ja, Sie können URLs aus jeder öffentlich zugänglichen Sitemap extrahieren. Die meisten Websites machen ihre Sitemaps öffentlich unter /sitemap.xml verfügbar oder referenzieren sie in ihrer robots.txt-Datei.

Wenn keine Sitemap unter der angegebenen URL existiert, gibt die Funktion einen Fehler zurück. Versuchen Sie, die robots.txt-Datei der Website (normalerweise unter /robots.txt) nach dem Sitemap-Speicherort zu durchsuchen, oder suchen Sie nach gängigen Pfaden wie /sitemap.xml, /sitemap_index.xml oder /sitemap/

Die Funktion konzentriert sich auf die Extraktion der URL-Liste für maximale Einfachheit und Benutzerfreundlichkeit. Die zurückgegebenen URLs sind die <loc>-Werte aus der Sitemap-XML.

Die meisten Websites platzieren ihre Sitemap unter /sitemap.xml. Sie können auch die robots.txt-Datei überprüfen (z.B. https://example.com/robots.txt), die oft eine Sitemap:-Anweisung enthält, die auf den Sitemap-Speicherort zeigt.

Ja, die Funktion kann gzip-komprimierte Sitemaps (.xml.gz) verarbeiten, solange der Server ordnungsgemäße Content-Encoding-Header bereitstellt.

Verwandte Funktionen

Beginnen Sie noch heute mit GET_URLS_FROM_SITEMAP

Installieren Sie Unlimited Sheets, um GET_URLS_FROM_SITEMAP und 41 weitere leistungsstarke Funktionen in Google Sheets zu erhalten.