Canonical Tag

Was ist ein Canonical?

Das Canonical Tag steht im Quellcode einer Website und verweist auf eine sogenannte kanonische URL, das heißt auf die Standardressource des Inhalts bei Websites, die identische oder annähernd identische Inhalte verwenden. Durch die Angabe des Canonical Tag kann Suchmaschinen mitgeteilt werden, dass nur die referenzierte Seite bei der Indexierung der Webseiten berücksichtigt werden soll.

Was bedeutet Canonical?

Der Begriff Canonical, auf Deutsch kanonisch, hat seinen Ursprung im lateinischen Wort canon, dass übersetzt Norm oder Regel bedeutet. Der lateinische Begriff stammt wiederum vom altgriechischen Wort kanón ab, das mit Leitfaden, Maßstab oder Maßgebendes übersetzt werden kann. Der altgriechische Begriff ist die Ableitung der Bezeichnung für einen Rohrstab, der als Längenmaß genutzt wurde. Übertragen auf das Webdesign verweist ein Canonical Tag auf die maßgebende Seite.

Warum ist das Canonical Tag wichtig?

Wenn Suchmaschinen viele URLs mit identischem (Duplicate Content) oder sehr ähnlichem Inhalt (Near Duplicate Content) crawlen, kann dies eine Reihe von SEO-Problemen verursachen. Wenn Crawler doppelte Inhalte auf Webseiten finden, können sie nicht unterscheiden, welche der Seiten mit identischem oder ähnlichem Inhalt die wichtigere ist. Dadurch kann die Ranking-Fähigkeit einzelner Seiten verwässert werden. Bei der Bewertung des Inhaltes können Suchmaschinen möglicherweise die falsche URL als “Original” auswählen. Mithilfe des Canonical Tags können Webmaster doppelten Inhalt steuern und den Suchmaschinen vorgeben, welche der durchsuchten Seiten die Originalseite ist.

Menschen betrachten eine Webseite, ohne lange zu überlegen oder die URLs zu analysieren als ein Gesamtkonzept und nicht als eigenständige Seiten. Für Suchmaschinen ist jedoch jede eindeutige URL eine separate Seite. Crawler und Besucher können beispielsweise die Startseite einer Webseite über die folgenden URLs erreichen:

  • http://www.beispiel.de
  • https://www.beispiel.de
  • http://beispiel.de
  • http://beispiel.de/index.php
  • http: //beispiel.de/index.php?a …

Für einen Menschen führen diese unterschiedlichen URLs, wenn Sie überhaupt beachtet werden, zu einem Ziel, auf die Startseite. Für einen Crawler wie den Google Bot handelt es sich jedoch um eigenständige Seiten mit identischem Inhalt. An diesem begrenzten Beispiel ist zu erkennen, dass für einen Crawler mehrere identische Kopien einer Homepage zu Problemen führen können. Tatsächlich ist dies jedoch nur eine kleine Auswahl der möglichen Varianten, die Crawler bewältigen müssen.

Seiten mit identischem Inhalt sind ein häufig auftretendes Problem in Onlineshops. Oft kann ein Produkt über verschieden URLs aufgerufen werden. Zum Beispiel würden die URLs

  • http://www.shop.de/gruene-lederschuhe.htm und
  • http://www.shop.de/herrenschuhe/gruene-lederschuhe.htm

zum gleichen Produkt führen. Die Inhalte der Seiten sind identisch, die URLs jedoch verschieden. Für Menschen ist dies kein Problem, für Suchmaschine dagegen schon. Im ungünstigsten Fall wird keine der beiden Seiten in den Index aufgenommen und in den Suchergebnissen gelistet.

Moderne Content Management Systeme (CMS) und dynamische Websites können das Problem noch zusätzlich verschärfen. Viele Systeme fügen Tags automatisch hinzu, lassen mehrere Pfade und URLs für den gleichen Inhalt zu und fügen URL-Parameter für Suchen, Sortierungen, Währungsoptionen und vieles mehr hinzu. Viele Webmaster wissen daher oft nicht, dass auf ihrer Webseite unzählige doppelte URLs existieren.

Die Funktion des Canonical Tag

Canonicals Tag sind HTML-Links mit dem Attribut rel = canonical. Im Februar 2009 wurde das Canonical Tag von Google, Bing und Yahoo! eingeführt. Mit dem Tag können Webseitenbetreiber eine Identifizierung der Inhalte einzelner Seiten durch Google & Co als Duplicate Content und die daraus resultierenden negativen Folgen für das Ranking der Seiten vermeiden. Mit Canonical Tags erfolgt die Auswahl der URL, die Suchmaschinen crawlen und indexieren sollen. Durch die Angabe der bevorzugten Version einer Webseite wird das Problem des doppelten Inhaltes, bei dem Suchmaschinen nicht wissen, welche Version des Inhalts angezeigt werden soll, gelöst.

Implementierung des Canonical Tag

Ein Canonical Tag kann auf zwei verschiedene Arten implementiert werden. Das Tag kann im < head>-Bereich des HTML-Dokuments oder im http-Header eingefügt werden. In den meisten Fällen erfolgt die Implementierung im HTML-Header, da sie einfach umzusetzen ist. Bei einigen Content Management Systeme besteht die Möglichkeit, das Canonical Tag mithilfe eines Plugin im HTML-Header zu platzieren. Bei der Implementierung im < head>-Bereich lautet die Syntax des Canonical Tag:

<link rel="canonical" href="https://www.example.de/musterseite.html"/>

Bei verschiedenen Dokumenten, die kein HTML enthalten, ist eine Platzierung im < head>-Bereich nicht möglich. Beispielsweise bei PDF-Dokumenten muss die Implementierung des Tags im http-Header erfolgen. Bei der Implementierung im HTTP-Header eines PDF-Dokumentes lautet die Syntax:

Link: < http://www.example.de /musterseite.pdf>; rel="canonical"

Google empfiehlt bei beiden Implementierungen, die Angabe der absoluten, das heißt, der gesamten URL.

Anwendung des Canonical Tag

  • Canonical Tags können selbstreferenziell sein: Selbstreferenziell bedeutet, ein Canonical Tag kann auf die Seite verwiesen, auf der es eingefügt ist. Grundsätzlich wird von Google empfohlen, dass eine Webseite per Canonical Tag auf sich selbst verweist, wenn keine Kopie existiert. Auf diese Weise werden die Spider der Suchmaschinen daran gehindert zum Beispiel URLs, die für Kampagnen verwendet werden, in den Index aufzunehmen.
  • Canonical Tags bei Druck-Versionen von URLs: Bei Webseiten ist es oft möglich, dass Besucher den Inhalt in eine Druckversion, meist ein PDF-Dokument, umwandeln und ausdrucken können. In vielen Fällen wird bei der Umwandlung eine eigene URL erzeugt. Auf diese Weise wird Duplicate Content generiert. Mithilfe eines Canonical Tags in der Druckversion kann auf die Originalseite verwiesen werden, um zu verhindern, dass die Druckversion in den Index aufgenommen wird.
  • Annähernd identische Inhalte kanonisieren: Im Allgemeinen wird es als sinnvoll angesehen, Canonical Tags auch für sehr ähnliche und nicht nur für 100-prozentig identische Seiten zu verwenden. Zum Beispiel für Produktseiten, die sich nur durch den Standort oder ein Produktattribut unterscheiden. Allerdings werden die anderen Versionen dieser Seite dann möglicherweise nicht für das Ranking infrage kommen. Wenn die Seiten sehr unterschiedlich sind, wird das Tag von den Suchmaschinen ignoriert.
  • Domainübergreifende Canonical Tags: befinden sich auf mehreren Webseiten, die von einem Betreiber verwaltet werden, identische oder fast identische Inhalte, können Canonical Tags eingesetzt werden, um eine Webseite für die Indexierung auszuwählen. Veröffentlicht beispielsweise ein Verlag den gleichen Artikel auf unterschiedlichen Domains, kann es sinnvoll sein, nur eine Domain für die Indexierung auszuwählen. Allerdings wir die Indexierung der anderen Domains für den Artikel dadurch unter Umständen unterbunden.
  • Canonical Tags und 301-Weiterleitungen: Es ist nicht ganz sicher, ob ein Canonical Tag den PageRank, Authority und andere wichtige Faktoren wie eine 301 Weiterleitung an die referenzierte Seite weitergibt. In den meisten Fällen scheint dies der Fall zu sein. Webmaster und SEOs sollten jedoch beachten, dass die beiden Methoden unterschiedliche Ergebnisse für die Besucher und Crawler einer Webseite zur Folge haben. Wenn eine 301 Weiterleitung von Seite A auf Seite B eingerichtet wird, werden menschliche Besucher automatisch auf Seite B geführt und sehen niemals Seite A. Wenn ein Canonical Tag eingefügt wird, der von Seite A auf Seite B verweist, wissen Crawler, dass Seite B die Ursprungsseite ist. Besucher können aber beide Seiten sehen. Webmaster sollten sicherstellen, dass die gewählte Lösung dem gewünschten Ergebnis entspricht.
  • Canonical Tags und Paginierung: Erfolgt bei Webseiten eine Paginierung mit rel=”prev” und rel=”next”, ist es empfehlenswert, entweder keine Canonical Tags zu nutzen oder diese so einzusetzen, dass sie sich selbst referenzieren.

Der Canonical Tag ist ein wichtiges Werkzeug für die Suchmaschinenoptimierung einer Webseite und sollte mit Bedacht verwendet werden. Bei nicht richtiger Anwendung können verschiedene Probleme auftreten:

  • hreflang und Canonical Tag: Wenn eine Webseite für Besucher mehrere Sprachversionen auf jeweils eigenen Seiten bereitstellt und mit hreflang auf diese verweist, ist es empfehlenswert, auf jeder Seite einen Canonical Tag zu platzieren, der selbst referenzierend ist oder keinen Canonical Tag zu nutzen. Finden Suchmaschinen beide Tags auf einer Seite, kann dies zu Problemen bei der Interpretation durch die Suchmaschinen führen. Der Canonical Tag macht die referenzierte Seite zur Hauptressource, während der hreflang Tag lediglich darauf hinweist, das es sich um eine andere Sprachversion handelt.
  • noindex und Canonical Tag: Die gleichzeitige Verwendung des Canonical Tags und noindex sollte vermieden werden. Suchmaschinen können eine Seite, die nicht indexiert werden soll, nicht als Hauptseite auswählen. Die gleichzeitige Verwendung eines Canonical Tags und “noindex” ist von Google ebenso nicht erwünscht wie die Kombination eines Canonicals mit “disallow” und “nofollow”- Tags.
  • Relative Verlinkung: Relative Verlinkungen bei einem Canonical Tag sollten vermieden werden, da diese Angabe von Suchmaschinen Spidern falsch interpretiert werden kann und der Tag im Zweifelsfall ignoriert wird.
  • Mehrere Canonical Tags auf einer Seite: Wenn auf einer Seite mehrere Canonical Tags vorhanden sind, ist diese Anweisung für Suchmaschinen unverständlich. Unter Umständen wird dann keine der Seite in den Suchmaschinenindex aufgenommen.
  • Canonical Tags bei Umzug der Domain: Canonical Tags eignen sich nicht, um nach dem Umzug einer Webseite auf eine neue Domain beziehungsweise die neue URL zu verweisen. In diesem Fall sollten 301 Weiterleitungen verwendet werden. Bei der Verwendung von Canonicals besteht die Gefahr, dass die Seiten der alten und der neuen URL nebeneinander im Index existieren. Hinzu kommt, dass dadurch auch Besucher verwirrt werden können, wenn sowohl die alte wie auch die neue Webseite erreichbar sind.
  • Fehlerhafte Syntax der URL: Bei der Verwendung von Canonical Tags sollte auf die korrekte und vollständige Schreibweise der URL geachtet werden. So müssen beispielsweise Trailing-Slashes “/” eingefügt werden, wenn diese bei der URL vorhanden sind. Probleme können auch entstehen, wenn ein Canonical ohne “www” auf eine Seite mit “www” verweist.
  • Verweise auf nicht erreichbaren Seiten: Webmaster sollten darauf achten, dass die im Canonical Tag angegebene URL und die ausgezeichnete Webseite tatsächlich erreichbar sind und kein 404-Fehler verursacht wird.

Tipp

Prüfen Sie regelmäßig den richtigen und sinnvollen Einsatz der genutzten Canonicals. Andernfalls könnten Suchmaschinen den Canonical-Tag ignorieren.


Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenlose SEO Analyse


Weitere Inhalte