Duplicate Content - Ursachen Und Vermeidung Von Doppelten Inhalten

Duplicate Content - Ursachen und Vermeidung von doppelten Inhalten

Von
Lucas Haiduck
25.02.2019
Duplicate Content - Ursachen und Vermeidung von doppelten Inhalten
TrafficDesign
https://www.trafficdesign.de/sites/all/themes/trafficdesign/images/trafficdesign-250.png

Wie entsteht Duplicate Content und was können Sie tun, um ihn zu bekämpfen? Oder besser: Um ihn von vorneherein zu vermeiden?

Duplicate Content (deutsch: doppelter Inhalt) bezeichnet Inhalte, die in gleicher oder sehr ähnlicher Form unter verschiedenen URLs im Web zu finden sind. Besonders für große Seiten wird das schnell zum Problem. 

Lesen Sie hier, was Sie gegen Duplicate Content tun können.

Sonnenblumen Duplicate Content

Was ist Duplicate Content?

Unter Duplicate Content versteht man das Vorhandensein von identischem oder sehr ähnlichem Inhalt auf verschiedenen Webseiten. Dies gilt sowohl für gleiche als auch unterschiedliche Domains. Im Folgenden betrachten wir dafür einige Beispiele für die verschiedenen Arten von Duplicate Content am Beispiel eines Onlineshops. 

Externer Duplicate Content

Externer Duplicate Content sind gleiche Inhalte, die sich auf verschiedenen Seiten im Web befinden. Ein klassisches Beispiel für den Onlineshop: Produktbeschreibungen.

Stellen Sie sich vor, Sie führen in Ihrem Onlineshop für Damenröcke den Faltenrock Mango Summer Breeze einer bekannten Modemarke. Sie beziehen den Artikel vom Hersteller und verkaufen ihn mit freundlicher Genehmigung von ebendiesem. Die Produktbeschreibung haben Sie ebenfalls vom Hersteller, da dieser das Produkt auch in seinem eigenen Shop vertreibt - ganz zu schweigen von den 17 anderen Onlineshops, die alle ebenfalls den Mango Summer Breeze anbieten. Wen wird Google wohl als Originalquelle der Produktbeschreibung identifizieren? Raten Sie mal...

Das Fazit: Die Produkte und - schlussendlich kritisch - die Produktbeschreibungstexte existieren nicht nur in Ihrem Shop, sondern auch auf anderen Domains.

Die Konsequenz: Sie werden unmöglich ein Spitzenranking für den Mango Summer Breeze aufbauen können! Google wird Ihren Content als minderwertig einstufen. Sollten sich die Duplikate in Ihrem Shop bis zu dem Punkt stapeln, dass man Ihnen Absichtlichkeit und Contentklau vorwerfen könnte, riskieren Sie sogar eine Abstrafung durch Google.

Was ist externer Duplicate Content Online Shop

Interner Duplicate Content

Interner Duplicate Content ist jede Art von Duplikat, die sich auf Ihrer eigenen Domain befindet und dort unter verschiedenen URLs abrufbar ist. Natürlich können sich interner und externer DC auch überschneiden, wenn Sie beispielsweise eine Produktbeschreibung von einer anderen Domain verwenden, die in Ihrem Shop dann auch noch mehrfach auftaucht. Doch wie kann es überhaupt dazu kommen, dass die gleichen Texte über verschiedene Adressen abrufbar sind?

Produkte in mehreren Kategorien

Aus Gründen der Usability ist es meist von Vorteil für den User, wenn Produkte in mehreren Kategorien auftauchen. So könnte der Mango Summer Breeze unter www.heart-rock-shop.de/roecke/faltenroecke, www.heart-rock-shop.de/roecke/sommerroecke oder auch www.heart-rock-shop.de/sonderangebote zu finden sein.

Tauchen Produkte Ihres Shops in mehreren Shop-Kategorien auf, ist das weniger ein inhärentes Problem von Duplicate Content als vielmehr eine Herausforderung der konsistenten Architektur Ihres Webshops. Wirklich problematisch wird es hierbei jedoch erst, wenn die Produktbeschreibungen umfangreicher gestaltet sind.

Oft tauchen auch Seitenduplikate unter ähnlichen aber unterschiedlichen URLs - mit und ohne Trailing Slash - auf. Achten Sie hier unbedingt auf Konsistenz bei der URL-Erstellung.

Duplicate Content durch Paginierung

Lange Produktlisten sind in vielen Shopsystemen über mehrere Seiten verteilt, um den User nicht auf den ersten Blick mit Produkten zu erschlagen. Im Hinblick auf Duplicate Content kann es problematisch werden, wenn sich SEO-Elemente und Textbausteine auf den Seiten wiederholen. Hier verwendet man am besten Canonical-Tags und fügt Paginierung für die verschiedenen Seiten hinzu. 

Duplicate Content durch Größen & Farben

Eines der größten Probleme für internen Duplicate Content im Onlineshop stellen Produktvariationen wie verschiedene Größen- und Farbauswahlen für Produkte dar.

Kommen wir zurück zu unserem Faltenrock: Sie vertreiben den Mango Summer Breeze, den es noch in einer weiteren Farbvariation gibt - Sea Green Tidal Wave.

Was ist interner Duplicate Content Online Shop

Die Produkte sind in Ihrem Onlineshop unter verschiedenen URLs zu finden und generieren so Duplicate Content, denn bis auf den Namen des Produkts sind die Beschreibungstexte identisch. Mehr noch: die beiden Produktvariationen konkurrieren in den SERPs für diverse wichtige Keywords miteinander!

Die beste Lösung hierfür ist, nur eine Produktseite zu erstellen, auf der die Farbe des Produkts per Filter ausgewählt werden kann, sodass sich die URL nicht ändert.

Eine weitere Lösung wäre ein Canonical-Tag von der weniger wichtigen Produktvariationen auf das gewünschte Hauptprodukt zu setzen. Das würde allerdings dazu führen, dass nur das Hauptprodukt in den Google Suchergebnissen erscheint!

Beeinflusst Duplicate Content das Ranking?

Kurz gesagt: Ja.

Google und der Googlebot bevorzugen einzigartigen "unique" Content. Das Ziel ist es zu einer Suchanfrage den relevantesten Inhalt auszuliefern. Ist nun Duplicate Content vorhanden, dann weiß Google nicht welcher Inhalt relevanter ist und teilt diesen Relevantswert unter den beiden Seiten auf. Die Folge ist eine Abstrafung im Ranking. Es kann sogar passieren, dass die Seite nicht indexiert wird. Besonders externer Duplicate Content ist ein Problem, da Google hier den Urheber des Originals nicht feststellen kann. 

Es gibt natürlich Situationen, in denen sich doppelte Inhalte nicht vermeiden lassen. Stellt man beispielsweise eine Druckversion einer Webseite zur Verfügung so ist diese eine inhaltliche Kopie. Hier kann man mit einem Canonical-Tag deutlich machen, dass es sich bei der Druckversion um eine Kopie handelt und verweist auf das Original.

Weitere Quellen von Duplicate Content

Es gibt natürlich noch viel mehr Ursachen für Duplicate Content. Nachfolgend werden häufige Ursachen beschrieben und eine Lösung beschrieben.

Duplicate Content durch falsche Serverkonfiguration bei Subdomain

Diese Art des doppelten Inhalts ist wohl eine der Häufigsten. Der Server antwortet auf allen Subdomains mit dem selben Content. Beispielsweise führt der Aufruf der Domain "www.beispiel.de" zum gleichen Inhalt wie der Aufruf der Domain "beispiel.de". Richtig kritisch wird es, wenn der Server bei allen Subdomains mit dem gleichen Inhalt antwortet. Die Lösung ist jedoch immer die selbe: Der Server muss korrekt konfiguriert werden. Bei einem Apache Server nutzt man das mod-rewrite Modul und konfiguriert eine .htaccess Datei im Root-Verzeichnis seines Webauftritts. Somit legt man sich auf eine Domain fest und die übrigen bekommen eine 301-Weiterleitung. Der Inhalt der .htaccess kann zum Beispiel so aussehen:

RewriteEngine On
# ! Weiterleitung Subdomains auf https und www !
RewriteCond %{HTTP_HOST} !^www.beispiel.de$ [NC]
RewriteRule (.*) https://www.beispiel.de/$1 [R=301,L]

Duplicate Content durch den Footer

Der Footer eines Webauftritts wird auf jeder Seite angezeigt. Prädestiniert für doppelten bzw. mehrfachen Inhalt, da sich oft viel zu viele Informationen im Footer befinden. Hier ist die Lösung: Weniger ist mehr. Ein stichpunktartiger Footer ist vollkommen ausreichend und erfüllt seinen Zweck. Komplexere Inhalte gehören auf eine eigene Unterseite. 

Duplicate Content durch länderspezifische Domains

Ein und dieselbe Domain mit mehreren Übersetzungen in Verzeichnissen (www.beispiel.de/en/ und /it/) gilt nicht als Duplicate Content. Für große Unternehmen kann es sinnvoll sein seinen Content in mehreren Sprachen anzubieten. Teilweise ist dies sogar nötig, da unterschiedliche Länder auch unterschiedliche Steuersätze haben. Aber wie geht man mit Domains um, die ihren Content in mehreren Ländern mit der selben Sprache anbieten?

Als Beispiel nehmen wir die DACH-Länder. Ein Shopbetreiber ist mit seiner Domain in diesen drei Ländern aktiv und hat eigene Verzeichnisse für die jeweiligen Länder und zwar: "www.beispiel.com/de/", "www.beispiel.com/at/" und "www.beispiel.com/ch/". Hier handelt es sich um Duplicate Content, da sich der selbe Content in drei Verzeichnissen befindet. Doch Google hat auch hierfür eine Lösung. 

Mit dem hreflang-Tag werden Webseiten-Inhalte einer Sprache oder Region zugeordnet. In unserem Beispiel sollte der hreflang-Tag auf der deutschen Seite so aussehen:

www.beispiel.com/de/

 <link rel=“alternate” hreflang=“de-DE” href=“https://www.beispiel.com/de/”/>
<link rel=“alternate” hreflang=“de-AT” href=“https://www.beispiel.com/at/”/>
<link rel=“alternate” hreflang=“de-CH” href=“https://www.beispiel.com/ch/”/>

Wie kann ich meine Webseite auf Duplicate Content überprüfen?

Es gibt viele Tools, um Ihnen die Suche nach Duplicate Content zu erleichtern. Allerdings ist auch der Google Index ein akkurater Indikator für schädliche doppelte Inhalte. Mithilfe von Suchoperatoren finden Sie schnell mehrfach indexierte Produktbeschreibungen oder gleiche Produkttitel unter verschiedenen URLs.

Externen Duplicate Content im Google Index finden

Externen Duplicate Content aufzuspüren ist eine leichte Übung! Kopieren Sie einfach einen Teil des verdächtigen Contents (bis zu 30 Zeichen) aus Ihrem Shop und suchen Sie danach in Anführungszeichen:

"Der Mango Summer Breeze ist ein besonderes Früchtchen und ein wahrer Hingucker für deinen Sommer-Look. Die faire Herstellung der Karunga Baumwolle machen den Faltenrock ..."

In den Suchergebnissen zeigt Google Ihnen nun alle Seiten, die exakt diesen Textbaustein enthalten. Die Reihenfolge der Suchergebnisse ist außerdem ein guter Indikator der Relevanz der Suchergebnisse für Google. 

Internen Duplicate Content aufspüren

Schwerer wird es schon, wenn nicht ganz klar ist, wo sich der doppelte Content verbirgt. Um internen Duplicate Content zu finden, können Sie ebenfalls den Google Index nutzen - bloß müssen Sie dabei die Suche auf Ihre Domain beschränken. Das können Sie ebenfalls mithilfe von Googles Suchoperatoren. Nehmen wir an, Ihre Domain lautet www.heart-rock-shop.de. Mit:

site:www.heart-rock-shop.de "Faltenrock Mango Summer Breeze"

finden Sie alle indexierten Seiten Ihrer Domain, die den String Faltenrock Mango Summer Breeze beinhalten. Wenn das noch nicht genau genug ist, können Sie weitere Operatoren verwenden, um die Suche einzugrenzen:

site:www.heart-rock-shop.de intitle:"Mango Summer Breeze"

gibt Ihnen alle Seiten Ihrer Domain, die Mango Summer Breeze im Meta-Title enthalten. Wenn Sie zusätzlich noch Produkte mit einem bestimmten Produktparameter (oder anderen String) in der URL suchen, verwenden Sie inurl:

site:heart-rock-shop.de inurl:id=375627 intitle:"Mango Summer Breeze"

Sie können ebenfalls bestimmte Seiten oder Verzeichnisse von den Suchergebnissen ausschließen, indem Sie ein Minus vor den site-Operator setzen: 

site:heart-rock-shop.de -site:heart-rock-shop.de/search-results/ intitle:"Mango Summer Breeze"

Das Beispiel findet Produkte in verschiedenen Kategorien mit dem Title Mango Summer Breeze auf Ihrer Domain, schließt aber gleichzeitig Suchergebnisseiten aus, für den Fall, dass Sie sich um diese schon gekümmert haben.

Wenn Sie etwas tiefer in die Materie einsteigen wollen, finden Sie bei uns eine Anleitung, wie Sie Domain internen Duplicate Content mit dem Screaming Frog finden können.

Top 4 Maßnahmen gegen Duplicate Content

Nun, da Sie alles über Duplicate Content wissen, werden Sie ihm in Zukunft natürlich aus dem Weg gehen. Sie wissen, wie Duplikate entstehen und können sie in Zukunft präventiv umgehen. Wie aber mit den doppelten Inhalten umgehen, die sich bereits vor der Erleuchtung angesammelt haben? Hier sind die Top 4 Tipps zur Beseitigung von Duplicate Content:

1. Canonicals setzen

Ein Canonical-Tag im Head-Bereich einer Website kennzeichnet deren inhaltliches Verhältnis zu einer Originalquelle. Dies ist eine besonders gute Lösung für internen Duplicate Content, wenn Produkte in mehreren Kategorien im Shop auftauchen. Findet man wie in unserem Beispiel also den Rock unter mehreren Kategorien, kann man auf allen Seiten, die nicht das Original sind, folgendes Tag in den HTML-Head der Seite einfügen:

<link rel="canonical" href="http://www.heart-rock-shop.de/faltenrock/mango-summer-breeze"/>

Die Suchmaschine weiß somit, dass nur das Produkt unter faltenrock/mango-summer-breeze indexiert werden soll.

2. Deindexierung durch Meta-Noindex

Wenn die Seite Duplicate Content enthält, aber Ihrer Einschätzung nach kein relevantes Suchergebnis für Ihre Besucher darstellt, können Sie die Seite auch deindexieren - sprich sie aus dem Google Suchergebnis Index nehmen. Dafür bauen Sie in den Head-Bereich der Seite das Tag:

<meta name="robots" content="noindex" />

ein. Dieses wird dem Googlebot empfehlen, die Seite nicht zu indexieren.

3. Verzeichnisse durch die robots.txt vom Crawling ausschließen

Wollen Sie hingegen verhindern, dass ganze Verzeichnisse wie z.B. /search-results/ gecrawlt werden, können Sie den Googlebot über die robots.txt vom Crawlen des entsprechenden Verzeichnisses abhalten:

User-agent: *
Disallow: /search-results/
Achtung: Der entscheidende Unterschied zum Noindex-Tag im Header ist, dass über die robots.txt ausgeschlossene Seiten gar nicht erst gecrawlt werden. Neue Seiten dieser Kategorie landen also nicht im Index, da sie vom Bot nicht gelesen werden. Verzeichnisse, die aber bereits im Index sind, bleiben auch weiterhin indexiert! Sie müssen per Noindex deindexiert werden. Vorsicht: Werden sie aber zusätzlich durch disallow über die robots.txt gekennzeichnet, werden sie gar nicht erst gecrawlt - und der entsprechende Hinweis noindex wird vom Bot nicht gelesen!

4. Unique Content schaffen

Dies ist nicht nur die absolut beste Lösung, um generell Duplicate Content zu vermeiden, sondern auch oft die einzig effektive, um externen DC wie z.B. in Produktbeschreibungen unter Kontrolle zu bekommen - denn die Lösungen 1 & 2 greifen nur bei der eigenen Domain. Das Setzen eines Canonicals auf die Originalquelle würde nur zur Folge haben, dass die eigene Produktseite vermutlich gar nicht indexiert wird.

Also: Das Zauberwort zur Öffnung der Tür in die SERPs lautet wie so oft: Unique Content! Natürlich ist das redaktionell sehr aufwendig und kann besonders bei großen Webauftritten nicht zeitnah umgesetzt werden, aber Google wird Ihre Bemühungen belohnen.

Beispiel gefällig?

Wir haben die Struktur übersichtlicher gemacht und dafür gesorgt, dass Duplicate Content vermieden wird. Zur Case Study von kölnticket.de »

Upcoming: In Teil 4 

Im vierten Teil der Reihe beschäftigen wir uns mit dem Herz Ihres Onlineshops: Den Produkten.


TrafficDesign ist Ihre SEO Agentur aus Köln und berät Sie bei Fragen zu Ihrem Webshop.

 

https://www.trafficdesign.de/sites/default/files/styles/twittercard/public/twitter-card-neu.jpg?itok=2myGKtDo
Fanden Sie den Artikel hilfreich?
Durchschnitt: 4.3 (44 votes)
Bild des Benutzers Lucas
Lucas Haiduck
Als Teil des Teams von TrafficDesign bin ich der Hauptverantwortliche für den Bereich SEO. Ich mag sowohl die großen Herausforderungen als auch die kleinen Projekte. Und... Pizza!

Brauchen Sie Unterstützung bei diesem Thema?

Sprechen Sie uns unverbindlich an und lassen Sie sich von uns beraten.

Anfrage schicken »


Kommentieren Sie diesen Artikel!

Schreiben Sie einen Kommentar und Sie bekommen zeitnah eine Rückmeldung von uns.

Kommentare

Bild des Benutzers Matthian Berg
Matthian Berg - 21. Juni 2019 - 20:26

Hallo, ich möchte eine Dienstleistung zum Thema sprachen lernen anbieten, und zwar zu vielen unterschiedlichen Sprachen. Die Dienstleistung an sich ist aber immer die gleiche (eine spezielle Art zu lernen).

D. h. ich könnte z. b. eine Seite zum Thema „englisch lernen“ erstellen. EXAKT DIE GLEICHE SEITE könnte ich zum Thema französich, spanisch, italienisch, etc lernen erstellen, ich würde nur statt „englisch“ die jeweils andere sprache schreiben. Aber das wäre ja eindeutig Duplicate Content, oder nicht?? Was wäre die Alternative?

Ich könnte mit dem canonical-tag eine original seite bestimmen, z. b. „englisch lernen“, mit dem tag von ALLEN anderen Seiten auf die „englisch lernen“-Seite verlinken, oder? aber dann würden all die anderen Seiten gar nicht in den SERP´s auftauchen, oder? Das wäre ja ein massiver Nachteil. D. h. wenn jemand nach „spanisch lernen“ googelt dann würde in den SERP´s meine Original-Seite „englisch lernen“ auftauchen. Das ist doch schlecht…oder es taucht gar keine meiner Seiten in den SERP´s auf? Das wäre noch schlechter.

Ich habe gelesen, dass es gut wäre, wenn man auf jeder Seite eigenen, also jeweils neu formulierten Content schreibt. Ich wüsste aber nicht, wie ich die Dienstleistung auf 10 verschiedene Arten beschreiben soll, bzw. wenn ich es tue, dann benutze ich bestimmte Worte (sprachschule, sprachkurs, sprache schnell lernen, und noch viele mehr) immer wieder, entweder weil sie gut passen, oder weil es Begriffe sind nach denen die Leute suchen, d. h. zumindest diese wichtigen Begriffe wären auf allen 10 Seiten gleich…wäre das dann nicht auch Duplicate Content? Falls ja, dann müsste ich diese Begriffe weniger benutzen, aber das ist ja total kontraproduktiv, weil wie gesagt diese begriffe gut meine Dienstleistung erklären UND nach Ihnen gesucht wird....also auch nicht wirklich ein gute Lösung, oder? Oder ist es vielleicht doch möglich die Seiten auf 10 verschiede Arten zu beschreiben UND dabei diese wichtigen Begriffe durchaus oft zu benutzen, aber irgendwie so, dass es doch kein Duplicate Content ist???

Was mir noch einfällt wäre, NUR EINE Seite zu erstellen, und auf dieser zu erklären, dass ich diese Dienstleistung für verschiedene Sprachen anbiete, aber da sehe ich den Nachteil, dass ich die einzelnen Worte „englisch“, oder “französisch“ oder „spanisch“ , und die restlichen Sprachen nicht oft verwenden kann. Sagen wir jemand googlet nach „englisch lernen“, und aus SEO-Sicht wäre es gut auf der Seite die ranken soll 10x „englisch“ einzubinden, das ginge, aber dann wäre da kein Platz mehr für 10x „französisch“, „spanisch“, etc. D. h. diese EINE Seite würde für englisch lernen evtl. gut ranken, aber kaum für die anderen Sprachen, oder??? Ausserdem ist es wohl auch aus verkaufstaktischer Sicht vermutlich besser dem Kunden der englisch lernen will eine Seite anzuziegen die EXAKT zum Thema „englisch lernen“ erstellt worden ist, und nicht eine auf der er theoretisch auch noch andere sprachen lernen könnte. Also auch ne schlechte Lösung…was ist in so einem Fall die best practise? danke

Bild des Benutzers Lucas
Lucas - 26. Juni 2019 - 10:58

Hallo Matthian,

 

du bist definitiv nicht der erste, der sich diese Frage stellt. Vor allem wenn es um Contentseiten geht ist Verfahren mit vermeintlichem Duplicate Content nicht immer so eindeutig wie in Onlineshops.

In deinem Fall solltest du das allerdings nicht zu eng sehen. Frage dich am besten: "Was ist gut für den User?" Denn das wird dann am Ende auch gut in der Suchmaschiene funktionieren.

Viele Fragestellungen hast du dir schon selbst beantwortet. Da würde ich überall zustimmen. Man will sich weder selbst durch Canonicals von der Indexierung ausschließen, noch eine einzige Seite für alle Sprachen.

Die beste Lösung wäre in diesem Fall tatsächlich, für jede Sprache eine Seite zu erstellen. Somit hast du die Möglichkeit, die entsprechenden URLs fokussiert auf die gewünschten Keywords zu optimieren. Sowohl über den Content, als auch generelle Onpage Optimierung wie Snippet, H1, interne Verlinkung etc.

Inwiefern es Duplicate Content ist, wenn bestimmte Begriffe oder Phrasen auf den Seiten doppelt vorkommen, sollte man in dem Fall nicht so eng sehen. Die Möglichkeiten jede der Seiten für den Nutzer einzigartig zu gestalten, sind hier ja recht umfangreich: Ein Bild mit Baguette und dem Eifelturm bei "Französisch lernen" sowie auf Frankreich angepasster Inhalt und Tapas und Rotwein bei "Spanisch lernen". Natürlich kommen dann Begriffe wie "Vokabeln" oder "Grammatik" seitenübergreifend vor, aber das ist in keiner Art und Weise ein Problem.
Umso einzigartiger die jeweiligen Seiten formuliert sind, umso besser. Aber auch das konkrete wiederholen von Phrasen oder Sätzen wird zumindest keine negativen Folgen haben: Mit Textbausteinen wie z.B. Boilerplate-Texte hat Google keine Probleme. Duplicate Content wird vielmehr zu einem Problem, wenn wirklich dieselben Seiten mehrfach bestehen – nicht bloß ähnliche Seiten mit eigentlich dezidiert unterschiedlicher Suchintention des Nutzers, die in deinem Fall ja durchaus gegeben ist.

Was die Inhaltserstellung selbst angeht: Sowas wie Keyworddichte gehört mittlerweile auch der Vergangenheit an. Dazu empfehlen wir unseren Artikel zum Schreiben guter SEO Texte.

Viel Erfolg mit dem Erstellen der Seiten und gute Rankings wünschen wir!

Kommentar verfassen