Duplicate Content (DC) – Eine Webseite war bei Google nicht mehr zu finden oder in den Rankings weit abgestürzt? Erster Verdacht war immer Duplicate Content als Verursacher einer Bestrafung durch Google. Immerhin wurden über Jahre hinweg Tipps verteilt wie man seine Webseite auf eine Domainvariante festlegt, Druckversion von der Indexierung ausschließt und allgemein alles tut, damit Google nur eine Variante eines Artikels findet.

Vor einigen Jahren hatte diese Paranoia im Bezug auf DC sicher auch noch Sinn, in letzter Zeit ist Google bei der Indexierung und dem Ausschluss doppelter Inhalte aber zunehmend intelligenter geworden und mittlerweile braucht man sich als normaler Webmaster über eventuelle doppelte Inhalte auf einer Webseite keine Sorgen mehr zu machen. Google formuliert es im Webmasterblog dann auch so:

… dass Duplicate Content in der Mehrzahl der Fälle keine negativen Effekte auf das Ranking eurer Site in unseren Suchergebnissen hat. Die doppelten Inhalte werden ganz einfach herausgefiltert …

Google behandelt dabei Übersetzungsversionen und kurze Zitate die mehrfach auf verschiedenen Seiten auftauchen ohnehin nicht als DC. Doppelter Content, der zum Beispiel entsteht, wenn man Webseiten-Versionen für Handys bereitstellt oder bestimmte Phransenbausteine wie Widerrufsbelehrung oder Versandkosten werden erkannt und als unproblematisch behandelt.

Erkennt Google derzeit DC außerhalb dieser Fälle wird versucht, zu ermitteln, welche der Seiten das Original ist und diese Seite wird indexiert. Alle anderen Seite gleichen Inhalts kommen nicht in den Index. Zur Ermittlung des Originals zieht Google dabei eine Vielzahl Faktoren heran. Unter anderem werden ausgewertet:

  • Linkstruktur (welche Version bekommt Backlinks von anderen Versionen)
  • Zeitpunkt der Indexierung
  • Webmaster-Angaben in den Webmastertools oder eine Sitemap

Aufgrund dieser Vorgehensweise Googles kann es also in den meisten Fällen maximal passieren, dass eine falsche Seite indexiert wird. Andere Seiten der Domain oder die Domain selbst werden nicht beeinflusst, es gibt keine Penalties die durch DC allein ausgelöst werden.

DC innerhalb der eigenen Seite

Am einfachsten kann man DC auf der eigenen Seite korrigieren, in dem man eine korrekte Sitemap bei Google einreicht und der Suchmaschine mitteilt, welche Version eines Artikels indexiert werden soll. Alternativ kann dies auch über die Webmastertools festgelegt werden, wobei eine automatisierte Sitemap viel Arbeit in diesem Bereich erspart. Die meisten modernen CMS bieten eine solche Option (teilweise als Plugin) an.

Darüber hinaus braucht man sich über DC auf der eigenen Domain an sich keine Gedanken zu machen.

DC auf verschiedenen Seiten

Wenn ein Artikel auf mehreren Seiten erscheint sollte man Wert darauf legen, das Kopien eine Backlink direkt zum Artikel zurück setzen. Aufgrund dieser Linkstruktur kann Google die Kopien leicht vom Original unterscheiden. Bei hartnäckigen SPAM Seiten kann man auch einen DMCA-Antrag bei Google stellen und den Spammer ausschließen lassen.

Das wäre dann auch der einzige Fall, in dem DC wirklich gravierende negative Auswirkungen haben kann: Wenn DC tatsächlich als Verstoß gegen die Webmasterrichtlinien gewertet wird. Dann ist nicht nur der Artikel betroffen sondern wirklich die gesamte Domain, allerdings muss dazu schon einiger vorliegen, wenige Artikel mit DC aus anderen Webseiten reichen dafür nicht aus.

Andere Beiträge zu diesem Thema:


Du kannst Beiträge dieses Blogs per RSS-Feed abonnieren
oder einen Trackback auf deiner Seite einrichten.