42. XML.Sitemap Erstellung

Titelbild Sitemap.XML

Copyright © Shutterstock/ProtasovAn

Die stetig wachsende Zahl von Websites und deren Komplexität war die Motivation für die Einführung der Sitemap.XML durch Google. Viele Business- oder E-Commerce-Sites umfassen Hunderte oder Tausende verschiedener Seiten innerhalb einer Domain. Die Sitemap hilft den Suchmaschinen, komplexe Webseiten zu crawlen, in dem sie den Crawlern den Weg zu den Seiten einer umfangreichen Internetpräsenz weist.

1. Was ist eine Sitemap.XML?

Die Sitemap.XML ist ein Werkzeug der Suchmaschinenoptimierung. Sie ist eine für Suchmaschinen erstellte Liste mit den auf einer Domain vorhandenen URLs. Die Sitemap.XML kann, muss aber nicht alle URLs der Domain enthalten. Sie dient ausschließlich als Information für Suchmaschinen und wird im von Google erstmals im Jahr 2005 veröffentlichten XML-Format erstellt. Gelegentlich werden HTML-Sitemap und Sitemap.XML miteinander verwechselt. Beide Sitemap-Typen haben jedoch unterschiedliche Funktionen.

Eine HTML Sitemap wird als Orientierung für die Besucher einer Webseite eingerichtet. Sie ist aufgebaut wie eine HTML Seite und listet die einzelnen Seiten einer Domain auf, die für Besucher sichtbar und erreichbar sind. Von der HTML Sitemap können Besucher direkt zu den einzelnen Seiten wechseln. Die HTML Sitemap ist gewissermaßen das von Menschen lesbare Inhaltsverzeichnis einer Website und erhöht damit die Benutzerfreundlichkeit einer Webseite. Zudem verbessert die HTML Sitemap die interne Verlinkung einer Domain, was wiederum den Suchmaschinen-Crawlern das Auffinden aller Seiten erleichtert.

Die Erstellung einer Sitemap.XML ermöglicht es Google, die URLs einer Website effektiv zu crawlen und das Crawling Budget optimal zu nutzen. Das sogenannte “Crawling Budget” für die Indexierung von Webseiten ist für jede Domain durch Google begrenzt. Google weist jeder Webseite anhand von bestimmten Faktoren wie der Ladegeschwindigkeit, ein bestimmtes Budget für das Crawlen der Inhalte zu. Von der Höhe des Crawling Budget ist abhängig, wie viele Seiten einer Domain in einem Durchgang gecrawlt werden können. Das individuelle Crawling Budget für eine Webseite kann in der Google Search Console unter Crawling > Crawling Statistiken eingesehen werden. Die Häufigkeit, mit der eine Website aktualisiert wird, kann ebenfalls als Information für Google in der Sitemap.XML zusammengefasst werden, ebenso wie die Daten, wann die Änderungen zuletzt vorgenommen wurden.

Das folgende Beispiel zeigt einen kurzen Ausschnitt der Sitemap.XML des ADAC:

< ?xml version=”1.0″ encoding=”UTF-8″?>

< urlset >

< url>
< loc>http://www.adac.de/datenschutz-dsgvo/online/
< priority>0.9< /priority>
< changefreq>daily< /changefreq>
< lastmod>2018-07-22< /lastmod>
< /url>

< url>
< loc>https://www.adac.de/kontakt/tab1_neu.aspx?tabid=tab1< /loc>
< priority>0.9< /priority>
< changefreq>daily< /changefreq>
< lastmod>2018-07-22< /lastmod>
< /url>

< url>
< loc>https://www.adac.de/mitgliedschaft/< /loc>
< priority>0.9< /priority>
< changefreq>daily< /changefreq>
< lastmod>2018-07-22< /lastmod>
< /url>

< url>
< loc>https://www.adac.de/mein-adac/< /loc>
< priority>0.9< /priority>
< changefreq>daily< /changefreq>
< lastmod>2018-07-22< /lastmod>
< /url>

< url>
< loc>http://www.adac.de/< /loc>
< priority>0.9< /priority>
< changefreq>daily< /changefreq>
< lastmod>2018-07-22< /lastmod>
< /url>

Anders als allgemein angenommen ist wahrscheinlich dass die Sitemap.XML keinen Einfluss auf das Ranking einer Website, obwohl sie Suchmaschinen hilft, Webseiten zu crawlen und alle Seiten zu finden. Es sollte beachtet werden, dass das Einreichen einer Sitemap keine Garantie für die Indexierung der URLs ist. Die Sitemap.XML kann das Crawlen neuer und geänderter Webseiten und deren Indexierung beschleunigen, ob und wie die in der Sitemap aufgeführten URLs indexiert werden, entscheiden jedoch die Suchmaschinen.

2. Wie erstellt man eine Sitemap.XML?

Es gibt verschiedene Möglichkeiten, eine XML-Sitemap zu erstellen. Unabhängig davon, ob die Sitemap manuell oder automatisiert mit einem Tool erstellt wird, ist es wichtig, zu beachten, dass eine Sitemap keine statische Datei ist, die einmal erstellt, für immer gültig ist. Eine Sitemap muss zeitnah aktualisiert werden, wenn eine neue Seite hinzugefügt wird oder wenn Änderungen an vorhandenen Seiten vorgenommen werden.

2.1 Tools für die Erstellung von Sitemaps

Für CMS wie WordPress stehen Plugins für die Erstellung einer Sitemap.XML zur Verfügung. Beispielsweise das Yoast SEO Plugin. Sitemap.XML können mit dem Yoast SEO Plugin automatisch generiert werden. Dies hat den Vorteil, dass die Sitemap immer auf dem neuesten Stand ist. Die Sitemaps können mit dem Plugin einfach aktiviert, deaktiviert und angezeigt werden. Zudem ist es möglich, die Anzahl der Sitemap-Einträge zu begrenzen. Ein weiteres Plugin für WordPress ist der Google Sitemap Generator. Das Plugin kann kostenlos aus dem WordPress Plugin Repository herunterladen und installieren werden. Nach der Aktivierung stehen eine Reihe von Optionen für die Sitemap-Erstellung zur Verfügung, die in SETTINGS / XML-SITEMAP individuelle konfiguriert werden können.

Für andere Webseiten stehen im Web zahlreiche kostenlos und kostenpflichtige SEO Tools wie der Screaming Frog, xml-sitemaps oder der Xml Sitemap Generator für die automatisierte Erstellung von Sitemap.XML zur Verfügung.

2.2 Was gilt es, bei der Erstellung zu beachten?

Bei der Erstellung einer Sitemap.XML sind eine Reihe von Punkten zu beachten, damit die Sitemap von Google und anderen Suchmaschinen verwendet werden kann. Grundsätzlich sollte beachtet werden, dass eine Sitemap.XML maximal 50.000 URLs beinhalten kann und die Größe 50 MB nicht übersteigen darf. Ist ein größerer Umfang erforderlich, sollten mehrere Sitemaps erstellt werden. Für die einzelnen Sitemaps kann dann eine Index-Datei erstellt werden, die auf die verschiedenen Sitemaps verweist.

Die Codierung der Sitemap sollte in UTF-8 erfolgen und das Entity-Escaping, das heißt, die Umcodierung bestimmter Zeichen, beachtet werden. So muss in der Sitemap “<” als & lt; oder “&” als & amp; geschrieben werden. Ein Sitemap wird in der Regel im Stammverzeichnis der Webseite gespeichert. Zum Beispiel meinewebseite.de/sitemap.xml. Dabei kann jede Sitemap nur die URLs für eine Domain oder Sub-Domain enthalten. Beispielsweise sind für meinewebseite.de und blog.meinewebseite.de jeweils separate Sitemap.XML erforderlich.

2.3 XML Sitemap Elemente

< urlset>: Dieses Tag ist erforderlich und ist das Element auf Dokumentebene innerhalb der Sitemap. Der Rest des Dokuments nach dem <? Xml version> -Tag (oder -Element) muss darin enthalten sein.

< url>: Dieses Element ist wichtig und unbedingt erforderlich. Dies ist das Eltern-Tag für jeden einzelnen Eintrag.

< sitemapindex>: Das Attribut sitemapindex wird ebenfalls benötigt und ist ein Element auf Dokumentebene, das im Sitemap-Index enthalten ist, wenn mehrere Sitemaps erstellt werden. Der Rest des Dokuments nach dem <? Xml version> -Tag sollte ebenfalls darin enthalten sein.

< sitemap>: Dieses Element ist unbedingt erforderlich. Dies ist das Elternelement für jeden einzelnen Eintrag, der im Index enthalten ist.

< loc>: Dieses Element liefert die vollständige URL der Sitemap oder Seite einschließlich des Protokolls und des abschließenden Schrägstrichs (falls dieser vom Hosting-Server der Website benötigt wird) und ist ebenfalls erforderlich. Dieser Wert darf nicht länger als 2.048 Zeichen sein.

< lastmod>: Obwohl für eine XML-Sitemap nicht erforderlich, zeigt dies das Datum an, an dem die Datei zuletzt geändert wurde. Es kann im vollständigen Datums- und Uhrzeitmodus oder nur im Datumsformat angezeigt werden.

< changefreq>: Dieses Attribut ist nicht erforderlich. Es gibt an, wie häufig sich die Webseite ändern könnte, möglich Angaben sind allways, hourly, daily, weekly, monthly und yearly. Wenn allways, also immer ausgewählt wird, bedeutet dies, dass sich die Dokumente bei jedem Zugriff auf die Website ändert. “Nie” wird verwendet, wenn die Dateien archiviert und in Zukunft nicht mehr geändert werden. Dieses Element wird nur als Richtlinie für Crawler verwendet und bestimmt nicht, wie häufig eine Website indiziert wird.

< priority>: Die Angabe einer Priorität ist nicht zwingend erforderlich. Dieses Element zeigt die Priorität einer bestimmten URL in Bezug auf andere URLs auf der Website an. Mit diesem Element kann jeder Webmaster den Crawlern vorschlagen, welche Seite wichtiger ist. Die Angabe reicht von 0.0 bis 1.0, wobei 1.0 die höchste Priorität ist. Der Standardwert für dieses Element ist 0,5. Es sollte beachtet werden, dass ein Versuch, alle Seiten einer Website mit hoher Priorität zu bewerten, keinen Einfluss auf deren Auflistung in den Suchmaschinen hat, da dies nur den Crawlern angezeigt wird.

Die Unterstützung für die zwingend erforderlichen Elemente ist weit verbreitet, während die Unterstützung für die nicht unbedingt benötigten Elemente in jeder Suchmaschine variiert.

Wie erfahren Suchmaschinen von der Sitemap?

Wenn die Sitemap fertig erstellt wurde, kann sie über die Google Search Console unter “Crawling > Sitemaps” bei Google eingereicht werden. Unter “Sitemaps” wird eine Liste der Sitemaps angezeigt, die ein Benutzer an die Search Console gesendet hat. Alle Sitemaps, die mit diesem Tool nicht gesendet wurden, werden nicht angezeigt. In der Tabelle können die Sitemaps aufgerufen werden, um weitere Informationen darüber zu erhalten, einschließlich aufgetretener Fehler.

Bild beispielhafte Analyse Sitemap Google Search Console

Beispielhafte Analyse einer Sitemap in der Google Search Console (Quelle: https://www.google.com/webmasters/tools/home?hl=de)

Wenn eine Sitemap getestet werden soll, kann dies unter “Sitemap hinzufügen / testen” und Eingabe der Sitemap URL mit einem anschließenden Klick auf “Test” geschehen. Wenn der Test abgeschlossen ist, werden in den Testergebnissen Fehler angezeigt, die behoben werden müssen. Nachdem die Fehler behoben wurden, kann die Sitemap an Google übermittelt werden. Es sollte beachtet werden, dass Google einige Zeit benötigt, um eine neue Sitemap zu verarbeiten.

2.4 Erneutes Übermitteln und Löschen einer Sitemap

Wenn eine überarbeitete Sitemap erneut eingereicht werden soll, kann im Sitemaps-Bericht aus der Tabelle die Sitemap ausgewählt werden, die erneut übermittelt werden soll. Nach einem Klick auf “Sitemap erneut einreichen” kann die Sitemap erneuert werden. Wenn eine Sitemap gelöscht wird, wird sie dauerhaft aus der Search Console entfernt. Das Löschen erfolgt wieder durch Auswahl der Sitemap aus der Tabelle und markieren des Kästchens neben den Sitemaps. Nach einem Klick auf “Löschen” wird die gewählte Sitemap entfernt. Dadurch wird die Sitemap allerdings nicht vom Webhost gelöscht, sodass Google sie möglicherweise weiterhin crawlen kann. Wenn verhindert soll, dass Google die Sitemap weiterhin nutzt, muss sie vom Webhost gelöscht oder in der robots.txt Datei gesperrt werden.

3. Welche Typen der Sitemap gibt es?

Neben der Standard Sitemap.XLM mit den URLs einer Webseite können noch Bilder-, News-, Video- und Mobile-Sitemaps sowie Sonderformen mit auf die jeweiligen Sitemaps abgestimmten XML-Tags verwendet werden.

3.1 Bilder- oder Image-Sitemap

Die Metadaten zu den auf einer Website verfügbaren Bildern werden mithilfe von Image-Sitemaps an Google übermittelt. Die Google Webmaster Richtlinien empfehlen dieses Vorgehen, um der Suchmaschine die Interpretation der Bilder und Bewertung für die Relevanz bei der Bildersuche zu erleichtern. Zudem können Webmaster in der Image-Sitemap angeben, welche Bilder für die Indexierung aus ihrer Sicht am wichtigsten sind. Durch die Image-Sitemap werden Bilder, die zum Beispiel mittels Java Script in die Webseite eingebunden werden, für die Suchmaschine sichtbar.

3.2 News-Sitemaps

Eine rechtzeitige Indizierung der Nachrichteninhalte auf einer Website ist wichtig. Eine News Sitemaps versorgt die Suchmaschine mit relevanten Metadaten über bestimmte Nachrichteninhalte, die auf der Website verfügbar sind. Die Verwendung einer News-Sitemap erleichtert Google News die Suche nach Nachrichten auf einer Website. Für eine umfassende Abdeckung werden die Crawler auf die URL für jede Nachricht geleitet.

Der Titel und das Datum der Veröffentlichung jedes Artikels werden durch die Sitemap identifiziert. Der Nachrichteninhalt wird mit Hilfe von Genres und Zugriffs-Tags spezifiziert. Beschreibungen wie relevante Schlüsselwörter und Stock-Sticks werden verwendet, um Artikelinhalte hervorzuheben. Google News eignet sich für neue Webseiten, Webseiten mit dynamischen Inhalten und Webseiten, die Pfade enthalten, bei denen mehrere Links angeklickt werden müssen, um einen Nachrichtenartikel zu erreichen. Um eine News-Sitemap nutzen zu können, muss zunächst die Aufnahme in Google News beantragt werden. Andernfalls ist das Einreichen der News-Sitemap bei Google nicht möglich sein.

3.3 Video-Sitemaps

Die Video-Sitemap liefert den Suchmaschinen die wichtigsten Metadaten über Videoinhalte auf einer Website. Webseiteninhaber können Video-Sitemaps verwenden, um Google über Details zu Videos wie Titel, Kategorie, Laufzeit, Beschreibung und Zielgruppe für jedes auf der Website hochgeladene Video zu informieren. Auf diese Weise kann Google den auf der Website verfügbaren Video-Content verstehen. Dies führt zu einer verbesserten Auflistung der Website in Videosuchergebnissen basierend auf bestimmten Keywords.

Die Videodetails können entweder in einer separaten Sitemap oder in der regulären Sitemap bereitgestellt werden. Die eingebundenen URLs für die Videos können über Google-Videos sowie andere von Google angebotene Suchplattformen durchsucht werden. Wenn Nutzer über Google auf die Videos zugreifen, werden der Videoinhalt und die zugehörigen Informationen als Miniaturbilder dargestellt, die aus der Sitemap extrahiert und dann mit den gehosteten Einstellungen für die Wiedergabe verbunden werden.

3.4 Mobile-Sitemaps

Die meisten Menschen greifen heute mit ihren mobilen Geräten wie Smartphones und Tablets auf das Internet zu. Anfänglich wurden mobile Websites und Sitemaps für sogenannte Feature-Phones entworfen, das heißt für Telefone, deren Browser nicht die üblichen Funktionen von Desktop-Browsern nutzten. Dies ist heute jedoch kaum mehr der Fall, da die meisten Smartphones ebenso leistungsfähige Browser wie ein Desktop-PC nutzen. Nur URLs, die Präsentationen wie WAP, die von Feature-Telefonen verwendet werden, werden bei der Übermittlung einer mobilen Sitemap als mobile URLs gezählt. Alle anderen Websites werden weiterhin als Web-URLs aufgeführt. Für Webmaster bedeutet dies, dass in der Regel auf eine Mobile Sitemap verzichtet werden kann.

3.5 Sitemap.XML und Hreflang

Das Einfügen des Hreflang Tag ermöglicht es Webmastern, den Suchmaschinen mitzuteilen, für welche Sprache und für welches Land/Region eine Webseite ausgerichtet ist. Die Angabe kann innerhalb des HTML-Codes einer Webseite oder in der Sitemap erfolgen.

4. Dont´s bei der Sitemap Erstellung

Einer der häufigsten Fehler, der bei der Erstellung einer Sitemap.XML geschieht, ist, dass die Kommunikation mit Google über eine bestimmte Seite nicht konsistent ist. Konsistenz im Bezug auf eine Sitemap bedeutet, dass eine URL, die in die Sitemap eingetragen wird, damit sie von Google gecrawlt wird, nicht gleichzeitig in der robots.txt-Datei durch ein “noindex, follow” von der Indexierung ausgeschlossen werden sollte. Eine Sitemap muss den richtigen Header, alle zwingend erforderlichen Attribute (< urlset>, < url> und < loc>), sowie das Protokoll der URLs (http oder https) enthalten und alle XML-Attribute sollten in einfache oder doppelte Anführungszeichen gesetzt werden, um eine Fehlermeldung beim Test der Sitemap in der Google Search Console zu vermeiden.

Wie bereits erwähnt, kann die Sitemap nicht in einem beliebigen Verzeichnis einer Webseite gespeichert werden. Dies ist ebenfalls ein häufiger Fehler. Befindet sich die Sitemap nicht im Stammverzeichnis, kann sie von den Suchmaschinen in der Regel nicht gefunden werden. Es ist zudem empfehlenswert, die URL der Sitemap in die robots.txt-Datei einzutragen.

Tippfehler oder Fehler im Programm eines Tools für die Erstellung einer Sitemap.XML können dafür verantwortlich sein, dass eine Sitemap nicht geöffnet und gelesen werden kann. Eine regelmäßige Überprüfung mit der Google Search Console ist daher empfehlenswert. Wenn ein Tool für die Sitemap-Generierung benutzt wird, sollte bedacht werden, dass diese Tools in der Regel alle URLs, die sie finden auch in die Sitemaps eintragen. Dazu gehören neben den URLs, die in der robots.txt-Datei für die Indexierung gesperrt sind auch die, die nicht mehr benötigt werden, sich aber noch im Verzeichnis befinden.

 

Fazit

Eine Sitemap ist ein wichtiges Werkzeug für die SEO und kann der treibende Faktor für den Erfolg einer Website sein. Eine Sitemap.XML ist jedoch nur eine Empfehlung an eine Suchmaschine, welche Seiten indexiert werden sollen. Sie ist kein Garant für eine tatsächliche Indexierung und hat keinen direkten Einfluss auf das Ranking einer Webseite. Dennoch stellt eine Sitemap.xml eine wichtige Verbindung zwischen einer Website und einer Suchmaschine her. Sie macht eine Website für alle Suchmaschinen einfacher durchsuchbar. Sitemaps bieten die Möglichkeit, Suchmaschinen sofort über Änderungen auf einer Website zu informieren. Webmaster können jedoch nicht erwarten, dass Suchmaschinen die geänderten Seiten sofort oder überhaupt indizieren, aber sicherlich werden die Änderungen bei der Nutzung einer Sitemap.XML schneller indiziert, als wenn keine Sitemap eingereicht wird.

(TitelbildCopyright © Shutterstock/ProtasovAn)

Kostenlose SEO Analyse



Weitere Inhalte


Keine Kommentare vorhanden


Du hast eine Frage oder eine Meinung zum Artikel? Teile sie mit uns!

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*
*