Duplicate Content – eine Geschichte voller Missverständnisse

Duplicate Content – eine Geschichte voller Missverständnisse  – Es geht eine Angst um unter den deutschen Webmastern: Duplicate Content. Was passiert, wenn Google auf der Webseite Inhalte entdeckt, die es eventuell auch auf anderen Seiten gibt – möglicherweise sogar auf fremden Webseite? Häufig herrscht die Meinung vor, dass dies dann negativ für die Seite ist und unter Umständen dazu führen kann, dass die Webseite abgestraft wird.

Tatsächlich legt Google Wert auf einzigartige Inhalte und Content, der selbst erstellt ist. Allerdings heißt dies natürlich nicht, dass gleiche Inhalte sofort ein Problem sind. Als Beispiel: wenn bereits kleinere Bereiche mit kleinen Inhalten ein Problem wären, hätten alle Zeitungen Schwierigkeiten, wenn beispielsweise Politiker-Zitate gebracht werden. Daher gibt es meistens zwei große Missverständnisse:

  • die meisten Fällen von doppeltem Content dürften nicht unter die Definition von Duplicate Content fallen
  • selbst wenn Google bestimmte Webseitenbereiche als Duplicate Content einstuft, gibt es in der Regel kaum negative Auswirkungen

Matt Cutts hat es einmal schön zusammengefasst: „Duplicate Content does happen„. Google weiß das natürlich auch und kann damit umgehen. Die Hintergründe zu diesen Punkten und warum man sich wegen Duplicate Content gar keine so großen Sorgen machen sollte, werden hier im Artikel erklärt.

Was ist Duplicate Content?

Duplicate Content sind noch einfach nur gleiche Teile auf einer Unterseite oder beispielsweise in der Sidebar. Google selbst erklärt, was das Unternehmen unter Duplicate Content versteht und was doppelte Inhalte sind und was nicht.  Die Definition, die Google anwendet, sieht wie folgt aus:

Duplizierte Inhalte sind umfangreiche Inhaltsblöcke, die anderen Inhalten in derselben oder einer anderen Domain entsprechen oder auffällig ähneln.

An der Stelle ist bereits ein Merkmal definiert: umfangreich. Es geht bei Duplicate Content um gleiche Sätze oder Wortgruppen, sondern um größere gleiche Textbereiche. Der Maximalfall wäre dabei, dass die komplette Webseite gleich ist, also dass eine andere Webseite 1:1 übernommen wurde.

Leider gibt Google aber keine Grenze vor, ab der ein Textbereich als „umfangreich“ gilt. Es existiert also keine feste Grenze für Duplicate Content. Man kann aber wohl davon ausgehen, dass es mehr als einige Sätze sein müssen, damit Google von Duplicate Content spricht. Umgekehrt gesagt: je mehr Inhalte von einer andere Seite übernommen wurden, desto eher geht Google von Duplicate Content aus.

Wie geht Google mit Duplicate Content um?

Wenn eine Webseite oder Teile davon durch Google als Duplicate Content identifiziert werden, hat das in der Regel keine direkten negativen Auswirkungen. Es gibt keine Abstrafung von Seiten der Suchmaschine, die nur wegen doppelten Inhalten vorgenommen wird. Google selbst gibt bei dieser Thematik daher Entwarnung:

Duplizierte Inhalte auf einer Website sind kein Grund, Maßnahmen gegen diese Website zu ergreifen, es sei denn, sie erwecken den Eindruck, dass Nutzer getäuscht und Suchmaschinenergebnisse manipuliert werden sollen. Falls Ihre Website duplizierte Inhalte enthält und Sie den oben beschriebenen Hinweisen nicht folgen, tun wir trotzdem unser Bestes, nur eine Version der Inhalte in unseren Suchergebnissen anzuzeigen.

In der Praxis heißt dies also, dass Duplicate Content an sich noch kein Problem ist, es sein denn, dass Google die Verwendung als missbräuchlich einstuft. Das sollte aber in den meisten Fällen nicht der Fall sein, wenn nicht Webseite 1:1 übernommen werden.

Auf der anderen Seite versucht Google aber, Duplicate Content Bereiche immer dem Original zuzuordnen. Wenn also auf einer Webseite gleiche Inhalte vorhanden sind, wird die Suchmaschinen versuchen, nur eine Seite davon im Index als Original auszugeben. Das gilt auch, wenn gleicher Inhalte auf unterschiedlichen Webseiten gefunden werden. Auch in diesem Fall wird Google versuchen, das Original zuerst anzuzeigen.

Video: Wie behandelt Google doppelte Inhalte

Welche Auswirkungen hat Duplicate Content in der Praxis?

Auch wenn Duplicate Content nicht direkt negative Auswirkungen auf eine Webseite hat und in der Regel auch keine Abstrafung deswegen zu befürchten ist, gibt es doch Auswirkungen auf die Suche und die Suchergebnisse. So helfen doppelte Content Bereichen beispielsweise nicht direkt beim Ranking. Wenn jemand gezielt nach dem doppelten Inhalte sucht, wird er vor allem die originale Seite finden und nicht die eigenen Seite.

Konkret: wenn jemand nach dem Inhalt des DC sucht, kann es sein, dass die eigene Seite nicht gut angezeigt wird. Um beim Beispiel von oben zu bleiben: Wenn jemand nach einem Politiker-Zitat sucht, wird Google versuchen, die Webseite zu ranken, die das Zitat zuerst enthalten hat und auf die sich die anderen Webseiten beziehen. Das betrifft aber nur Suchen nach gezielt diesem Inhalt. Die anderen Suchen und Keywords sich nicht betroffen.

Aus Nutzersicht macht es daher trotzdem Sinn, mit doppelten Inhalten zu arbeiten und beispielsweise Zitate in den eigenen Content einzubauen, auch wenn sie auf einer oder anderen Webseiten bereits vorhanden sind. Wenn man dies noch mit korrekten Quellenangaben macht, kann es sogar die eigene Seite stärken, weil auf diese Weise natürlich die Qualität des Contents ausgebaut wird.

Prinzipiell gilt daher auch für Duplicate Content, was Google immer sagt: Inhalte sollte für die Nutzer entwickelt werden und man sollte sich nicht zu viele Gedanken darüber machen, wie Google darauf reagiert. Wenn also doppelte Inhalte in welcher Form auch immer für die Nutzer interessant und wichtig sind, sollte man sie nutzen.

Doppelte Inhalte vermeiden: diese Tipps gibt Google

  • Verwende 301-Weiterleitungen: Falls du deine Website neu strukturiert hast, kannst du Nutzer, den Googlebot und andere Spider über 301-Weiterleitungen („RedirectPermanent“) in der .htaccess-Datei intelligent weiterleiten. Diese Weiterleitung lässt sich bei Apache über eine .htaccess-Datei und bei IIS über die Verwaltungskonsole vornehmen.
  • Achte auf Einheitlichkeit: Verwende immer dieselben internen Links. Beispielsweise solltest du Linkvariationen wie http://www.example.com/page/http://www.example.com/page und http://www.example.com/page/index.htm nicht gleichzeitig verwenden.
  • Verwende Top-Level-Domains: Damit wir die richtige Version eines Dokuments zur Verfügung stellen können, solltest du für landesspezifische Inhalte vorzugsweise Top-Level-Domains verwenden. Beispielsweise verweist http://www.example.de eher auf landesspezifische Inhalte für Deutschland als http://www.example.com/de oder http://de.example.com.
  • Syndiziere sorgfältig: Wenn du deine Inhalte auf anderen Websites syndizierst, wird bei Google immer die Version angezeigt, die wir bei der jeweiligen Suche für die passendste halten. Das ist unter Umständen nicht immer deine bevorzugte Variante. Daher solltest du dafür sorgen, dass jede Website, auf der deine Inhalte syndiziert werden, einen Link zurück zum ursprünglichen Artikel enthält. Du kannst auch die Nutzer deines Materials darum bitten, das Meta-Tag noindex zu verwenden, um die Indexierung ihrer Version der Inhalte durch Suchmaschinen zu unterbinden.
  • Reduziere wiederkehrende Textbausteine: Anstatt am Ende jeder Seite umfangreiche Urheberrechtshinweise einzufügen, kannst du eine kurze Zusammenfassung mit einem Link zu detaillierten Informationen einfügen. Darüber hinaus kannst du mit dem Tool Parameterbehandlung festlegen, wie Google URL-Parameter behandeln soll.
  • Vermeide die Veröffentlichung von Platzhaltern: Nutzer mögen keine „leeren“ Seiten. Veröffentliche beispielsweise keine Seiten, für die du noch keine richtigen Inhalte hast. Falls du Platzhalterseiten erstellst, blockiere die Indexierung dieser Seiten mithilfe des Meta-Tags noindex.
  • Mach dich mit deinem CMS (Content-Management-System) vertraut: Sorge dafür, dass du weißt, wie Inhalte auf deiner Website angezeigt werden. Blogs, Foren und ähnliche Systeme zeigen gleiche Inhalte oft in verschiedenen Formaten an. So kann z. B. ein Blogeintrag sowohl auf der Startseite eines Blogs als auch auf einer Archivseite und auf einer Seite mit anderen Einträgen mit derselben Kennzeichnung erscheinen.
  • Reduziere ähnliche Inhalte: Falls du viele sehr ähnliche Seiten hast, solltest du entweder die einzelnen Seiten erweitern oder alle Seiten zu einer Seite zusammenfassen. Wenn du beispielsweise eine Reisewebsite hast und darauf zwei Seiten für zwei Städte vorhanden sind, die weitgehend die gleichen Informationen enthalten, kannst du diese Seiten entweder zu einer Seite für beide Städte zusammenfassen oder den jeweiligen Städteseiten weitere, jeweils spezifische Informationen zu den Städten hinzufügen, um sie unähnlicher zu machen.

23 Kommentare zu "Duplicate Content – eine Geschichte voller Missverständnisse"

  1. Je einzigartiger die Inhalte einer Seite innerhalb einer Domain sind,umso vorteilhafter. Ich mache aber auch die Beobachtung, dass große Textabschnitte sich ähneln. Doch der Webmaster ist von Abstrafungen weit entfernt, weil sie vom jeweiligen Schlüsselbegriff Fokus unterschiedlich sind.

  2. Hallo,

    ich sehe vor allem bei Online Shops und größeren Seiten immer wieder eine Menge an Duplicate Content. Oftmals wird das aber auch durch eine Einstellung im CMS oder Shop System verursacht. Zur Identifikation und darauffolgenden Eliminierung nutze ich gerne Screamingfrog als Tool. Wie ist deine Erfahrung damit oder gibt es aus deiner Sicht noch bessere Möglichkeiten duplicate Content zu identifizieren?

    LG
    Noah

  3. Hi Bastian,

    am gravierendsten finde ich wirkt sich duplicate content, also sich kannibalisierender Content bei den Metadaten aus.
    Hier ist mit Screaming Frog schnell Abhilfe geschaffen, um unnötige Duplikate zu vermeiden.

    VG Timo

  4. Grundsätzlich geht es ja darum, dass man Inhalte nicht 1:1 von anderen Seiten kopiert. Ich denke, wenn man gut recherchiert und entsprechenden Content erstellt, ist die Wahrscheinlichkeit, dass es zu Duplicate Content kommt, sehr gering. Also einfach fleißig sein und nicht kopieren 😉

  5. Sehe es ähnlich wie Timo.
    Duplicate Content in den Metadaten wirkt sich am schlimmsten aus, bzw. man sieht sehr schnell Erfolge, wenn man hier Duplicate Content beseitigt.

  6. Ganz so einfach ist das nicht. Es gibt viele Webseiten und Shops, die aufgrund einer falsch aufgesetzten Technik massenhaft Duplikate erzeugen. Da ist schnell ein einziger Inhalt unter mehreren URLs erreichbar. Streaming Frog findet da leider auch nicht alles, vor allem nicht wenn diese „falschen“ Seiten schlecht intern verlinkt sind. Ich nutze das Tool aber auch gerne. Aber zusätzlich auch mal in die Search Console schauen, ob dort URLs angezeigt werden die einem komisch vorkommen. Und abgleichen wie viele Seiten man an sich hat und wieviele Seiten Google gefunden hat. Wenn ein Blog nur 50 Seiten hat, Google aber 500 angibt, sollte man mal einen Blick auf die Technik werfen. 🙂

  7. Auch wenn die Technik stimmt gibt es Duplicate Content wenn eine Homepage für zwei englischsprachige Länder EN und USA jeweils eine extra Seite hat. Dann habe ich zwangsläufig erst einmal Duplicate Content. Da ist viel Textarbeit nötig wenn es bei gleichem Inhalt trotzdem unterschiedliche Meta-Tags, Beschreibungstexte und Bildunterschriften geben soll.

  8. Schliesse mich auch Timo an – und mit Screaming Frog werde ich mir das nun auch einmal genauer ansehen.
    Vielen Dank für den tollen Artikel

  9. Interessanter Artikel! Danke, dass Sie über „duplicate content“ geschrieben haben. Ich habe etwas Neues gelernt.

  10. Meine Erfahrung mit Duplicate Content ist man sollte es nicht übertreiben, sich wiederholende Textbausteine auf zwei oder drei Unterseiten sind nicht dramatisch wenn der restliche Text weitestgehend einzigartig ist.

  11. Je universeller der Content umso besser auch die Ranking Chancen. Vielen Dank für den tollen Artikel!

  12. Hey,
    vielen Dank für diesen informativen Beitrag.
    Duplicate Content ist gut, solange man ihn richtig einzusetzen weiß.
    LG aus Hannover,
    Anthea

  13. Meiner Erfahrung nach korreliert die Einstufung von Text als Duplicate Content in einem negativem Sinne, sehr stark mit der reinen Quantität an (sinnvollem) Text auf der entsprechenden Seite. Soll heißen, DC-Phrasen in einem starken semantischen Umfeld sind eher unwichtig. Wenn natürlich eine Webseite ohnehin relativ wenig Textuelles bietet, dann wird DC natürlich viel eher als negativ von den Google-Algorithmen angesehen.

  14. Mit dem richtigen Content kann man sich absetzten von der Konkurrenz und wenn man sein Zielgruppe richtig versteht gezielt darauf aufbauen.

  15. Startupbrett | Mai 22, 2021 um 10:54 |

    Hallo,
    vielen Dank für diesen Artikel! Vor einigen Wochen hat Google ja bekannt gegeben, dass das Thema Duplicate Content keine große Rolle mehr spielt. Wie steht ihr nun zu diesem Thema?
    LG

  16. Hallo,
    danke für diesen interessanten Beitrag. Nutzt ihr denn zur Identifizierung von Duplicate Content bestimmte Tools die ihr mir empfehlen könnt?
    LG Martin

  17. Sehr interessanter und ausführlicher Artikel. Duplicate Content ist leider immer wieder mal ein leidiges Thema, um das man nicht durmrum kommt. Daher sehr gut ausgearbeitet.
    LG

  18. Hi, danke für den interessanten Beitrag. Ich finde die Pankikmache, die da teilweise betrieben wird echt krass. Google kann recht gut mit Dublicate Content umgehen und ich konnte auch noch keine negativen Effekte bei Rankings feststellen.

    Grüße Max

  19. Ehrlich gesagt, kann ich das selbst nicht bewerten, wie das bewertet worden ist.

  20. Ja bei Duplicate Content muss man leider sehr aufpassen, grade bei größeren Webseiten können solche Fehler schnell mal aus Versehen passieren

  21. Dieser Artikel hat viele meiner Fragen zum Thema „Duplicate Content“ beantwortet. Ich habe den Artikel sehr gerne gelesen und interessante Ideen daraus schöpfen können. Macht weiter so und schreibt interessante Artikel über Top-Themen.

  22. Das mit der Weiterleitung ist ein hilfreicher Tipp. Wir hatten das Problem, dass durch einen Ratgeber welcher auf jeder Seite eingefügt war DP entstand. Es gibt auch einen DP Hecker kostenfrei, dieser hat uns sehr geholfen die Fehler zu analysieren und zu beseitigen. Es geht nichts über Unique Content

  23. Oh ja, das kenne ich nur zu gut. Oft liest man im Internet etwas, und plötzlich wird es als allgemeingültig angesehen. Im Bereich SEO wimmelt es geradezu von Experten, die sich mit Halbwissen auskennen. Besonders beim Thema Duplicate Content gibt es verschiedene Formen, die häufig missverstanden werden. Es ist jedoch möglich, Webseiten so zu optimieren, dass Google die Originalinhalte besser erkennt und effizienter crawlen kann. Dazu gehören Maßnahmen wie die richtige Verwendung von Canonical-Tags, die Vermeidung technischer Fehler und die gezielte Strukturierung der Inhalte, um Dopplungen zu vermeiden.

Hinterlasse einen Kommentar

E-Mail Adresse wird nicht veröffentlicht.


*