Duplicate Content - Ursachen Und Vermeidung Von Doppelten Inhalten

Duplicate Content - Ursachen und Vermeidung von doppelten Inhalten

Von
Bild des Benutzers Lucas
Lucas Haiduck
verfasst am 25.02.2019
Duplicate Content - Ursachen und Vermeidung von doppelten Inhalten
TrafficDesign
https://www.trafficdesign.de/sites/all/themes/trafficdesign/images/trafficdesign-250.png

Wie entsteht Duplicate Content und was können Sie tun, um ihn zu bekämpfen? Oder besser: Um ihn von vorneherein zu vermeiden?

Duplicate Content (deutsch: doppelter Inhalt) bezeichnet Inhalte, die in gleicher oder sehr ähnlicher Form unter verschiedenen URLs im Web zu finden sind. Besonders für große Seiten wird das schnell zum Problem. 

Lesen Sie hier, was Sie gegen Duplicate Content tun können.

Sonnenblumen Duplicate Content

Was ist Duplicate Content?

Unter Duplicate Content versteht man das Vorhandensein von identischem oder sehr ähnlichem Inhalt auf verschiedenen Webseiten. Dies gilt sowohl für gleiche als auch unterschiedliche Domains. Im Folgenden betrachten wir dafür einige Beispiele für die verschiedenen Arten von Duplicate Content am Beispiel eines Onlineshops. 

Externer Duplicate Content

Externer Duplicate Content sind gleiche Inhalte, die sich auf verschiedenen Seiten im Web befinden. Ein klassisches Beispiel für den Onlineshop: Produktbeschreibungen.

Stellen Sie sich vor, Sie führen in Ihrem Onlineshop für Damenröcke den Faltenrock Mango Summer Breeze einer bekannten Modemarke. Sie beziehen den Artikel vom Hersteller und verkaufen ihn mit freundlicher Genehmigung von ebendiesem. Die Produktbeschreibung haben Sie ebenfalls vom Hersteller, da dieser das Produkt auch in seinem eigenen Shop vertreibt - ganz zu schweigen von den 17 anderen Onlineshops, die alle ebenfalls den Mango Summer Breeze anbieten. Wen wird Google wohl als Originalquelle der Produktbeschreibung identifizieren? Raten Sie mal...

Das Fazit: Die Produkte und - schlussendlich kritisch - die Produktbeschreibungstexte existieren nicht nur in Ihrem Shop, sondern auch auf anderen Domains.

Die Konsequenz: Sie werden unmöglich ein Spitzenranking für den Mango Summer Breeze aufbauen können! Google wird Ihren Content als minderwertig einstufen. Sollten sich die Duplikate in Ihrem Shop bis zu dem Punkt stapeln, dass man Ihnen Absichtlichkeit und Contentklau vorwerfen könnte, riskieren Sie sogar eine Abstrafung durch Google.

Was ist externer Duplicate Content Online Shop

Interner Duplicate Content

Interner Duplicate Content ist jede Art von Duplikat, die sich auf Ihrer eigenen Domain befindet und dort unter verschiedenen URLs abrufbar ist. Natürlich können sich interner und externer DC auch überschneiden, wenn Sie beispielsweise eine Produktbeschreibung von einer anderen Domain verwenden, die in Ihrem Shop dann auch noch mehrfach auftaucht. Doch wie kann es überhaupt dazu kommen, dass die gleichen Texte über verschiedene Adressen abrufbar sind?

Produkte in mehreren Kategorien

Aus Gründen der Usability ist es meist von Vorteil für den User, wenn Produkte in mehreren Kategorien auftauchen. So könnte der Mango Summer Breeze unter www.heart-rock-shop.de/roecke/faltenroecke, www.heart-rock-shop.de/roecke/sommerroecke oder auch www.heart-rock-shop.de/sonderangebote zu finden sein.

Tauchen Produkte Ihres Shops in mehreren Shop-Kategorien auf, ist das weniger ein inhärentes Problem von Duplicate Content als vielmehr eine Herausforderung der konsistenten Architektur Ihres Webshops. Wirklich problematisch wird es hierbei jedoch erst, wenn die Produktbeschreibungen umfangreicher gestaltet sind.

Oft tauchen auch Seitenduplikate unter ähnlichen aber unterschiedlichen URLs - mit und ohne Trailing Slash - auf. Achten Sie hier unbedingt auf Konsistenz bei der URL-Erstellung.

Duplicate Content durch Paginierung

Lange Produktlisten sind in vielen Shopsystemen über mehrere Seiten verteilt, um den User nicht auf den ersten Blick mit Produkten zu erschlagen. Im Hinblick auf Duplicate Content kann es problematisch werden, wenn sich SEO-Elemente und Textbausteine auf den Seiten wiederholen. Hier verwendet man am besten Canonical-Tags und fügt Paginierung für die verschiedenen Seiten hinzu. 

Duplicate Content durch Größen & Farben

Eines der größten Probleme für internen Duplicate Content im Onlineshop stellen Produktvariationen wie verschiedene Größen- und Farbauswahlen für Produkte dar.

Kommen wir zurück zu unserem Faltenrock: Sie vertreiben den Mango Summer Breeze, den es noch in einer weiteren Farbvariation gibt - Sea Green Tidal Wave.

Was ist interner Duplicate Content Online Shop

Die Produkte sind in Ihrem Onlineshop unter verschiedenen URLs zu finden und generieren so Duplicate Content, denn bis auf den Namen des Produkts sind die Beschreibungstexte identisch. Mehr noch: die beiden Produktvariationen konkurrieren in den SERPs für diverse wichtige Keywords miteinander!

Die beste Lösung hierfür ist, nur eine Produktseite zu erstellen, auf der die Farbe des Produkts per Filter ausgewählt werden kann, sodass sich die URL nicht ändert.

Eine weitere Lösung wäre ein Canonical-Tag von der weniger wichtigen Produktvariationen auf das gewünschte Hauptprodukt zu setzen. Das würde allerdings dazu führen, dass nur das Hauptprodukt in den Google Suchergebnissen erscheint!

Beeinflusst Duplicate Content das Ranking?

Kurz gesagt: Ja.

Google und der Googlebot bevorzugen einzigartigen "unique" Content. Das Ziel ist es zu einer Suchanfrage den relevantesten Inhalt auszuliefern. Ist nun Duplicate Content vorhanden, dann weiß Google nicht welcher Inhalt relevanter ist und teilt diesen Relevantswert unter den beiden Seiten auf. Die Folge ist eine Abstrafung im Ranking. Es kann sogar passieren, dass die Seite nicht indexiert wird. Besonders externer Duplicate Content ist ein Problem, da Google hier den Urheber des Originals nicht feststellen kann. 

Es gibt natürlich Situationen, in denen sich doppelte Inhalte nicht vermeiden lassen. Stellt man beispielsweise eine Druckversion einer Webseite zur Verfügung so ist diese eine inhaltliche Kopie. Hier kann man mit einem Canonical-Tag deutlich machen, dass es sich bei der Druckversion um eine Kopie handelt und verweist auf das Original.

Weitere Quellen von Duplicate Content

Es gibt natürlich noch viel mehr Ursachen für Duplicate Content. Nachfolgend werden häufige Ursachen beschrieben und eine Lösung beschrieben.

Duplicate Content durch falsche Serverkonfiguration bei Subdomain

Diese Art des doppelten Inhalts ist wohl eine der Häufigsten. Der Server antwortet auf allen Subdomains mit dem selben Content. Beispielsweise führt der Aufruf der Domain "www.beispiel.de" zum gleichen Inhalt wie der Aufruf der Domain "beispiel.de". Richtig kritisch wird es, wenn der Server bei allen Subdomains mit dem gleichen Inhalt antwortet. Die Lösung ist jedoch immer die selbe: Der Server muss korrekt konfiguriert werden. Bei einem Apache Server nutzt man das mod-rewrite Modul und konfiguriert eine .htaccess Datei im Root-Verzeichnis seines Webauftritts. Somit legt man sich auf eine Domain fest und die übrigen bekommen eine 301-Weiterleitung. Der Inhalt der .htaccess kann zum Beispiel so aussehen:

RewriteEngine On
# ! Weiterleitung Subdomains auf https und www !
RewriteCond %{HTTP_HOST} !^www.beispiel.de$ [NC]
RewriteRule (.*) https://www.beispiel.de/$1 [R=301,L]

Duplicate Content durch den Footer

Der Footer eines Webauftritts wird auf jeder Seite angezeigt. Prädestiniert für doppelten bzw. mehrfachen Inhalt, da sich oft viel zu viele Informationen im Footer befinden. Hier ist die Lösung: Weniger ist mehr. Ein stichpunktartiger Footer ist vollkommen ausreichend und erfüllt seinen Zweck. Komplexere Inhalte gehören auf eine eigene Unterseite. 

Duplicate Content durch länderspezifische Domains

Ein und dieselbe Domain mit mehreren Übersetzungen in Verzeichnissen (www.beispiel.de/en/ und /it/) gilt nicht als Duplicate Content. Für große Unternehmen kann es sinnvoll sein seinen Content in mehreren Sprachen anzubieten. Teilweise ist dies sogar nötig, da unterschiedliche Länder auch unterschiedliche Steuersätze haben. Aber wie geht man mit Domains um, die ihren Content in mehreren Ländern mit der selben Sprache anbieten?

Als Beispiel nehmen wir die DACH-Länder. Ein Shopbetreiber ist mit seiner Domain in diesen drei Ländern aktiv und hat eigene Verzeichnisse für die jeweiligen Länder und zwar: "www.beispiel.com/de/", "www.beispiel.com/at/" und "www.beispiel.com/ch/". Hier handelt es sich um Duplicate Content, da sich der selbe Content in drei Verzeichnissen befindet. Doch Google hat auch hierfür eine Lösung. 

Mit dem hreflang-Tag werden Webseiten-Inhalte einer Sprache oder Region zugeordnet. In unserem Beispiel sollte der hreflang-Tag auf der deutschen Seite so aussehen:

www.beispiel.com/de/

 <link rel=“alternate” hreflang=“de-DE” href=“https://www.beispiel.com/de/”/>
<link rel=“alternate” hreflang=“de-AT” href=“https://www.beispiel.com/at/”/>
<link rel=“alternate” hreflang=“de-CH” href=“https://www.beispiel.com/ch/”/>

Wie kann ich meine Webseite auf Duplicate Content überprüfen?

Es gibt viele Tools, um Ihnen die Suche nach Duplicate Content zu erleichtern. Allerdings ist auch der Google Index ein akkurater Indikator für schädliche doppelte Inhalte. Mithilfe von Suchoperatoren finden Sie schnell mehrfach indexierte Produktbeschreibungen oder gleiche Produkttitel unter verschiedenen URLs.

Externen Duplicate Content im Google Index finden

Externen Duplicate Content aufzuspüren ist eine leichte Übung! Kopieren Sie einfach einen Teil des verdächtigen Contents (bis zu 30 Zeichen) aus Ihrem Shop und suchen Sie danach in Anführungszeichen:

"Der Mango Summer Breeze ist ein besonderes Früchtchen und ein wahrer Hingucker für deinen Sommer-Look. Die faire Herstellung der Karunga Baumwolle machen den Faltenrock ..."

In den Suchergebnissen zeigt Google Ihnen nun alle Seiten, die exakt diesen Textbaustein enthalten. Die Reihenfolge der Suchergebnisse ist außerdem ein guter Indikator der Relevanz der Suchergebnisse für Google. 

Internen Duplicate Content aufspüren

Schwerer wird es schon, wenn nicht ganz klar ist, wo sich der doppelte Content verbirgt. Um internen Duplicate Content zu finden, können Sie ebenfalls den Google Index nutzen - bloß müssen Sie dabei die Suche auf Ihre Domain beschränken. Das können Sie ebenfalls mithilfe von Googles Suchoperatoren. Nehmen wir an, Ihre Domain lautet www.heart-rock-shop.de. Mit:

site:www.heart-rock-shop.de "Faltenrock Mango Summer Breeze"

finden Sie alle indexierten Seiten Ihrer Domain, die den String Faltenrock Mango Summer Breeze beinhalten. Wenn das noch nicht genau genug ist, können Sie weitere Operatoren verwenden, um die Suche einzugrenzen:

site:www.heart-rock-shop.de intitle:"Mango Summer Breeze"

gibt Ihnen alle Seiten Ihrer Domain, die Mango Summer Breeze im Meta-Title enthalten. Wenn Sie zusätzlich noch Produkte mit einem bestimmten Produktparameter (oder anderen String) in der URL suchen, verwenden Sie inurl:

site:heart-rock-shop.de inurl:id=375627 intitle:"Mango Summer Breeze"

Sie können ebenfalls bestimmte Seiten oder Verzeichnisse von den Suchergebnissen ausschließen, indem Sie ein Minus vor den site-Operator setzen: 

site:heart-rock-shop.de -site:heart-rock-shop.de/search-results/ intitle:"Mango Summer Breeze"

Das Beispiel findet Produkte in verschiedenen Kategorien mit dem Title Mango Summer Breeze auf Ihrer Domain, schließt aber gleichzeitig Suchergebnisseiten aus, für den Fall, dass Sie sich um diese schon gekümmert haben.

Wenn Sie etwas tiefer in die Materie einsteigen wollen, finden Sie bei uns eine Anleitung, wie Sie Domain internen Duplicate Content mit dem Screaming Frog finden können.

Top 4 Maßnahmen gegen Duplicate Content

Nun, da Sie alles über Duplicate Content wissen, werden Sie ihm in Zukunft natürlich aus dem Weg gehen. Sie wissen, wie Duplikate entstehen und können sie in Zukunft präventiv umgehen. Wie aber mit den doppelten Inhalten umgehen, die sich bereits vor der Erleuchtung angesammelt haben? Hier sind die Top 4 Tipps zur Beseitigung von Duplicate Content:

1. Canonicals setzen

Ein Canonical-Tag im Head-Bereich einer Website kennzeichnet deren inhaltliches Verhältnis zu einer Originalquelle. Dies ist eine besonders gute Lösung für internen Duplicate Content, wenn Produkte in mehreren Kategorien im Shop auftauchen. Findet man wie in unserem Beispiel also den Rock unter mehreren Kategorien, kann man auf allen Seiten, die nicht das Original sind, folgendes Tag in den HTML-Head der Seite einfügen:

<link rel="canonical" href="http://www.heart-rock-shop.de/faltenrock/mango-summer-breeze"/>

Die Suchmaschine weiß somit, dass nur das Produkt unter faltenrock/mango-summer-breeze indexiert werden soll.

2. Deindexierung durch Meta-Noindex

Wenn die Seite Duplicate Content enthält, aber Ihrer Einschätzung nach kein relevantes Suchergebnis für Ihre Besucher darstellt, können Sie die Seite auch deindexieren - sprich sie aus dem Google Suchergebnis Index nehmen. Dafür bauen Sie in den Head-Bereich der Seite das Tag:

<meta name="robots" content="noindex" />

ein. Dieses wird dem Googlebot empfehlen, die Seite nicht zu indexieren.

3. Verzeichnisse durch die robots.txt vom Crawling ausschließen

Wollen Sie hingegen verhindern, dass ganze Verzeichnisse wie z.B. /search-results/ gecrawlt werden, können Sie den Googlebot über die robots.txt vom Crawlen des entsprechenden Verzeichnisses abhalten:

User-agent: *
Disallow: /search-results/
Achtung: Der entscheidende Unterschied zum Noindex-Tag im Header ist, dass über die robots.txt ausgeschlossene Seiten gar nicht erst gecrawlt werden. Neue Seiten dieser Kategorie landen also nicht im Index, da sie vom Bot nicht gelesen werden. Verzeichnisse, die aber bereits im Index sind, bleiben auch weiterhin indexiert! Sie müssen per Noindex deindexiert werden. Vorsicht: Werden sie aber zusätzlich durch disallow über die robots.txt gekennzeichnet, werden sie gar nicht erst gecrawlt - und der entsprechende Hinweis noindex wird vom Bot nicht gelesen!

4. Unique Content schaffen

Dies ist nicht nur die absolut beste Lösung, um generell Duplicate Content zu vermeiden, sondern auch oft die einzig effektive, um externen DC wie z.B. in Produktbeschreibungen unter Kontrolle zu bekommen - denn die Lösungen 1 & 2 greifen nur bei der eigenen Domain. Das Setzen eines Canonicals auf die Originalquelle würde nur zur Folge haben, dass die eigene Produktseite vermutlich gar nicht indexiert wird.

Also: Das Zauberwort zur Öffnung der Tür in die SERPs lautet wie so oft: Unique Content! Natürlich ist das redaktionell sehr aufwendig und kann besonders bei großen Webauftritten nicht zeitnah umgesetzt werden, aber Google wird Ihre Bemühungen belohnen.

Beispiel gefällig?

Wir haben die Struktur übersichtlicher gemacht und dafür gesorgt, dass Duplicate Content vermieden wird. Zur Case Study von kölnticket.de »

Upcoming: In Teil 4 

Im vierten Teil der Reihe beschäftigen wir uns mit dem Herz Ihres Onlineshops: Den Produkten.


TrafficDesign ist Ihre SEO Agentur aus Köln und berät Sie bei Fragen zu Ihrem Webshop.

 

https://www.trafficdesign.de/sites/default/files/styles/twittercard/public/twitter-card-neu.jpg?itok=2myGKtDo
Fanden Sie den Artikel hilfreich?
Durchschnitt: 4.3 (41 votes)
Bild des Benutzers Lucas
Lucas Haiduck
Als Teil des Teams von TrafficDesign bin ich der Hauptverantwortliche für den Bereich SEO. Ich mag sowohl die großen Herausforderungen als auch die kleinen Projekte. Und... Pizza!

Brauchen Sie Unterstützung bei diesem Thema?

Sprechen Sie uns unverbindlich an und lassen Sie sich von uns beraten.

Anfrage schicken »


Kommentieren Sie diesen Artikel!

Schreiben Sie einen Kommentar und Sie bekommen zeitnah eine Rückmeldung von uns.

Kommentar verfassen