SEO: Wie Duplicate Content das Google Ranking beeinflusst

11. April 2020

Spricht man über Suchmaschinen-Optimierung, dann fällt früher oder später der Begriff «Duplicate Content». Was hat es mit diesen doppelten Inhalten auf sich – und wie dramatisch ist ihr Einfluss auf das Suchmaschinen-Ranking? Muss man Massnahmen gegen Duplicate Content ergreifen – oder kann man sogar davon profitieren, dass man Inhalte kopiert?

Was ist Duplicate Content?

Duplicate Content liegt immer dann vor, wenn derselbe Inhalt über mehrere unterschiedliche URLs gefunden wird. Im wesentlichen kann man dabei zwei Fälle unterscheiden:

Fall A: mehrere unterschiedliche URLs zeigen auf dieselbe Webpage
Fall B: auf mehreren unterschiedlichen Webpages wird derselbe Content publiziert

In beiden Fällen ist es für einen Suchmaschinen-Benutzer wenig hilfreich, wenn er bei einer Suchanfrage mehrere Resultate erhält, die ihn letztlich zu denselben Inhalten führen. Google (und auch alle anderen Suchmaschinen) versuchen deshalb, Duplicate Content zu erkennen und zu eliminieren.

Mit anderen Worten: Findet Google unter mehreren Adressen dieselben Inhalte, dann wird nur eine dieser Adressen in der Trefferliste auftauchen. In der Regel bleibt diejenige URL übrig, unter der dieser Inhalt vom Google Bot erstmals gefunden wurde, denn das Original ist logischerweise immer älter als eine Kopie. Unter Umständen werden aber auch andere Faktoren hinzugezogen, etwa die Anzahl der Links, die auf eine URL zeigen. Und falls derselbe Content auf unterschiedlichen Websites auftaucht, dann dürfte auch die Autorität der Website insgesamt eine Rolle spielen.

Fall A: Unterschiedliche URLs für dieselbe Webpage

Warum kann es überhaupt passieren, dass dieselbe Webpage über unterschiedliche URLs erreichbar ist? Die folgenden Beispiele zeigen, dass es mehrere Gründe gibt.

Beispiel 1

Während früher das www am Anfang einer Web-Adresse fast zwingend war, geben heute viele Benutzer URLs ohne dieses führende www ein. Deshalb sind Webserver in der Regel so konfiguriert, dass sie sowohl www.example.com als auch example.com verarbeiten können.

Die entscheidende Frage ist aber, ob einfach beide Schreibweisen akzeptiert werden oder ob eine Weiterleitung von example.com auf www.example.com stattfindet. Fehlt die Weiterleitung, dann sind example.com/products/model-123.html und www.example.com/products/model-123.html zwei unterschiedliche URLs, die aber identischen Code zurückliefern.

Beispiel 2

Besitzt man mehrere Domains, aber nur eine einzige Website, dann wird man alle Domains auf dieselbe Website mappen. Dies führt dazu, dass beim Aufruf der drei folgenden URLs immer dieselbe Webpage ausgeliefert wird und Google folglich Duplicate Content feststellt:

www.example.com/products/model-123.html www.example.net/products/model-123.html www.example-germany.de/products/model-123.html

Beispiel 3

Dynamische Websites (und das sind heutzutage die meisten) ergänzen URLs oft mit Parameterwerten. Diese werden ganz einfach hinten an die eigentliche URL angehängt und bilden den sogenannten Query String. Unter Umständen führen aber unterschiedliche Query Strings zu denselben Resultaten.

Man kann dies an einem einfachen Beispiel zeigen: Bereits eine Veränderung der Parameterreihenfolge erzeugt unterschiedliche URLs – die Website liefert aber trotzdem dieselbe Page aus (und generiert damit in den Augen einer Suchmaschine Duplicate Content):

www.example.com/index.php?a=1&b=2 www.example.com/index.php?b=2&a=1

Selbst wenn die Parameter im Query String unterschiedlich sind, kann es durchaus sein, dass die resultierende Webpage inhaltlich identisch ist:

www.example.com/index.php?category=smartphones www.example.com/index.php?category=smartphones&sortorder=default www.example.com/index.php?category=smartphones&session-id=h37ekojpf4432c93

Beispiel 4

Sprechende URLs – also nicht-technische, aussagekräftige und gut merkbare Web-Adressen – sind sowohl für die Usability als auch für die Suchmaschinen-Optimierung von Vorteil. Fast alle Content-Management-Systeme bieten deshalb die Möglichkeit, für jede Webpage manuell eine solche sprechende URL zu vergeben.

Technisch gesehen ist dies aber nichts anderes als eine Umleitung. Und somit führen im folgenden Beispiel zwei komplett unterschiedliche URLs zu exakt derselben Webpage:

www.example.com/shop.php?product=726833751
www.example.com/apple/iphone/11-pro

Ist der Fall A ein Problem?

Ist Duplicate Content, der auf diese Weise entsteht, ein Problem? Eigentlich nicht. Denn solange Google zumindest eine der verschiedenen URLs in der Trefferliste aufführt, wird die Webpage ja trotzdem gefunden. Allenfalls bleibt dann zwar nicht diejenige URL übrig, die sich der Website-Betreiber gewünscht hätte (z.B. www.example.com/shop.php?productid=726833751 statt www.example.com/apple/iphone/11-pro). Aber das ist ein untergeordnetes Problem, das man zudem mit einer geeigneten Konfiguration des Webservers lösen kann.

Fall B: Kopierte Inhalte auf unterschiedlichen Webpages

Wenden wir uns nun dem Fall B zu: Wie kann es sein, dass derselbe Content auf unterschiedlichen Webpages auftaucht?

Wie Kopien entstehen

Eine naheliegende Erklärung ist die, dass jemand Content von einer fremden Website kopiert und auf seiner eigenen Website publiziert. Das muss nicht zwingend illegal sein: Vielleicht wurde der Inhalt unter einer Lizenz veröffentlicht, welche die Weiterverwendung erlaubt, oder die Inhalte sind aus anderen Gründen nicht durch das Urheberrecht geschützt.

Unter Umständen wird eine solche Kopie sogar mit Wissen und Zustimmung des Urhebers veröffentlicht, weil sich dieser eine grössere Reichweite für seine Inhalte erhofft. Ein typischer Fall sind Medienmitteilungen, welche von Unternehmen verschickt werden und dann von anderen Websites unverändert publiziert werden. Ein anderer Fall wäre, dass ein Autor von einem Newsportal oder einem Blog angefragt wird, ob er einen bestehenden Artikel nicht auch dort veröffentlichen möchte.

Was Kopien bewirken

Für Google macht das aber keinen Unterschied: Existiert derselbe Content auf zwei verschiedenen Websites, dann wird nur eine dieser beiden Websites in den Suchresultaten erscheinen. Überlegen wir uns, was das für Sie bedeutet:

Falls Sie der Urheber sind, dann haben Sie selbstverständlich ein Interesse daran, dass Google Ihre eigene Website (und nicht die Website mit der Kopie Ihrer Inhalte) aufführt. Falls die Kopie mit Ihrer Zustimmung erstellt wurde, dann bitten Sie den Betreiber der anderen Website, eine Code-Zeile in der folgenden Form in seine Kopie einzufügen: <link rel="canonical" href="https://example.com/original-artikel/" /> Dadurch weiss Google nicht nur, dass es sich um eine Kopie handelt, sondern auch gleich, wo das Original zu finden ist. Falls die Kopie allerdings gegen Ihren Willen erstellt wurde, dann können Sie lediglich darauf hoffen, dass Google aufgrund des Veröffentlichungszeitpunkts erkennt, dass Ihre Website das Original ist.
Falls Sie fremde Inhalte kopieren, dann müssen Sie sich bewusst sein, dass Ihnen diese Inhalte höchstwahrscheinlich nichts nützen für die Suchmaschinen-Optimierung. Wenn Sie beispielsweise Inhalte aus der Wikipedia (legal) oder von der NZZ-Website (illegal) kopieren, dann wird Ihre Website damit garantiert nicht bei Google gefunden. Und es ist nicht auszuschliessen, dass es dem Ranking Ihrer Website insgesamt schadet, wenn Google darauf im grossen Stil Duplicate Content findet.
Falls Sie eigene Inhalte kopieren, weil Sie selbst mehrere Websites betreiben, dann sollten Sie sich überlegen, welche dieser Websites für Sie am wichtigsten ist. Bauen Sie dann wie oben beschrieben das Canonical Tag in alle anderen Websites ein, damit auch Google Ihre Präferenz versteht.

Fazit

Wie man sieht, kann Duplicate Content sehr unterschiedliche Ursachen haben: Zum einen sind es rein technische Gründe wie im Fall A, zum anderen die (erwünschte oder unerwünschte) Mehrfachverwendung von Content wie im Fall B.

Insgesamt kommt Google mit Duplicate Content gut zurecht: Duplikate werden meist im Sinne der Suchmaschinen-Benutzer und Content-Urheber eliminiert, während Plagiatoren und Content-Piraten das Nachsehen haben. Zudem kann man mit Weiterleitungen und dem Canonical-Tag in vielen Fällen korrigierend eingreifen.

Auch eine Abstrafung durch Google muss man nicht gewärtigen, solange nicht ein klarer Fall von Spamming vorliegt. Denn auch Google weiss, dass Duplicate Content schlicht Realität ist und meist nicht durch böse Absicht entsteht. Oder wie es Matt Cutts einst lakonisch formulierte: «Duplicate content does happen.»

Deshalb würden wir meinen: Die Problematik von Duplicate Content wird tendenziell überbewertet. Andererseits muss man auch ganz klar festhalten: Fremden Content zu kopieren statt eigenen Content zu erstellen, ist aus Sicht der Suchmaschinen-Optimierung sinnlos oder gar kontraproduktiv.

Computer-Bildschirm mit der Website von SEOprofiler

Unsere SEO-Dienstleistungen

Wird Ihre Website über die Google-Suche gefunden?

Wir analysieren Ihr Google Ranking basierend auf geeigneten SEO Keywords und erarbeiten einen Massnahmenplan für die Suchmaschinen-Optimierung Ihrer Website. Gerne unterstützen wir Sie auch bei der Umsetzung dieser Massnahmen.

Mehr erfahren