Duplicate Content

Picture of Ferenc Collinet
Ferenc Collinet

Sie kennen das sicher: Sie stehen im Supermarkt vor dem Regal und sehen zwei exakt gleiche Produkte – selbe Marke, selbe Verpackung, selber Inhalt. Aber eines kostet 1,99 Euro und das andere 2,49 Euro. Welches nehmen Sie? Und vor allem: Fragen Sie sich nicht sofort, was hier eigentlich los ist?

Für Google fühlt sich Duplicate Content (doppelter Inhalt) ganz ähnlich an. Die Suchmaschine steht vor zwei, drei oder manchmal hundert fast identischen Webseiten und muss entscheiden: Welche davon ist das Original? Welche soll ich den Nutzern zeigen? Und welche ignoriere ich?

In der SEO-Welt ist Duplicate Content eines der am meisten missverstandenen Themen. Es kursieren Horrorgeschichten über Abstrafungen (Penalties) und den kompletten Verlust der Sichtbarkeit. Wir können Sie beruhigen: Ganz so dramatisch ist es meistens nicht. Aber: Doppelte Inhalte sind Sand im Getriebe Ihrer Website. Sie verschwenden Ressourcen, verwirren den Algorithmus und bremsen Ihren Erfolg.

In diesem Artikel räumen wir mit Mythen auf. Wir erklären Ihnen genau, was Duplicate Content ist, warum er entsteht (oft ganz unschuldig) und wie Sie ihn mit den richtigen technischen Werkzeugen wie Canonicals und Redirects sauber in den Griff bekommen.

Dies ist ein Teil unserer Serie zu den SEO-Grundlagen.

Was ist Duplicate Content?

Duplicate Content bezeichnet Inhalte, die innerhalb einer oder über mehrere Domains hinweg identisch oder sehr ähnlich sind. Stellen Sie es sich wie einen Zeitungsartikel vor, der am selben Tag wortgleich in der Hamburger Morgenpost und der Berliner Zeitung erscheint.

Aus technischer Sicht bedeutet es: Ein und derselbe Inhalt ist unter verschiedenen URLs erreichbar.

Google definiert das recht nüchtern: „Duplicate Content bezieht sich im Allgemeinen auf Inhaltsblöcke, die innerhalb oder zwischen Domains entweder komplett identisch sind oder sich sehr stark ähneln.“

Es gibt zwei Hauptarten, die wir unterscheiden müssen:

  1. Interner Duplicate Content: Dies ist der häufigste Fall. Hierbei entstehen Duplikate auf Ihrer eigenen Website. Zum Beispiel ist Ihre Startseite sowohl unter http://beispiel.de als auch unter http://www.beispiel.de erreichbar. Für Nutzer sieht das gleich aus, für Google sind es zwei völlig verschiedene Adressen mit identischem Inhalt.
  2. Externer Duplicate Content: Hierbei tauchen Ihre Inhalte auf anderen Websites auf. Das kann passieren, wenn Sie Pressemitteilungen veröffentlichen, die von Portalen 1:1 übernommen werden, oder wenn Sie Ihre Produkte auch auf Marktplätzen wie Amazon mit denselben Produkttexten listen.

Was ist „Near-Duplicate“?

Nicht immer muss der Text zu 100 % identisch sein. Wenn Sie einen Online-Shop für Schuhe haben und für das Modell „Sneaker XY“ in Rot, Blau und Grün jeweils eine eigene URL anlegen, unterscheidet sich auf diesen Seiten oft nur das Wort der Farbe und das Produktbild. Der restliche Text (Beschreibung, Pflegehinweise, Versandinfos) ist gleich. Google nennt dies „Near-Duplicate“ (nahezu identisches Duplikat). Auch das kann Probleme verursachen, wenn Sie dem Bot nicht erklären, wie er damit umgehen soll.

Warum das selten eine „Strafe“ ist (aber trotzdem weh tut)

Lassen Sie uns direkt mit dem größten Mythos aufräumen: Es gibt keine automatische „Duplicate Content Penalty“ (Abstrafung), bei der Google Sie aus Rache aus dem Index wirft, nur weil Sie versehentlich ein paar doppelte Seiten haben.

Google versteht, dass Duplikate oft technische Ursachen haben und nicht böswillig erstellt wurden. Wenn Sie nicht gerade versuchen, Suchergebnisse massiv zu manipulieren oder urheberrechtlich geschützte Inhalte anderer zu klauen, haben Sie keine manuelle Abstrafung zu befürchten.

Aber warum ist Duplicate Content dann trotzdem schlecht für Ihr SEO?

Auch ohne Strafe tut es weh, und zwar aus drei Gründen:

  1. Verwässerung der Linkkraft (Link Juice):
    Stellen Sie sich vor, drei Websites verlinken auf Ihren tollen Ratgeber. Einer verlinkt auf Version A, einer auf Version B und einer auf Version C. Anstatt dass eine URL die geballte Kraft von drei Backlinks bekommt, verteilt sich die Autorität auf drei Duplikate. Keine der Seiten baut genug Stärke auf, um Top-Rankings zu erzielen.
  2. Verschwendung von Crawl Budget:
    Der Googlebot hat nur begrenzte Zeit und Ressourcen für Ihre Website. Wenn er sich durch 500 Varianten derselben Produktseite wühlen muss, die durch URL-Parameter entstanden sind, fehlt ihm die Zeit, Ihre wirklich wichtigen, einzigartigen neuen Inhalte zu finden. Mehr dazu finden Sie in unserem Artikel über Crawling vs. Indexierung.
  3. Unkontrollierte URL-Auswahl:
    Wenn Google drei identische Versionen findet, wählt der Algorithmus selbst eine aus, die er in den Suchergebnissen anzeigt. Die anderen werden gefiltert. Das Problem: Oft wählt Google nicht die Version, die Sie dort haben wollen (z. B. die veraltete Druckversion statt der modernen Landingpage). Sie verlieren die Kontrolle darüber, wie Ihre Marke in der Suche präsentiert wird.

Häufige Ursachen (mit Mini-Beispielen)

Duplicate Content entsteht selten, weil jemand absichtlich Texte kopiert. Meistens ist es ein technischer Unfall. Ihr Content-Management-System (CMS) oder Ihre Shop-Software generiert URLs, an die Sie gar nicht gedacht haben.

Hier sind die fünf häufigsten Szenarien, die wir in unseren Audits finden:

1. Protokolle und Subdomains (HTTP/HTTPS & WWW)

Dies ist der Klassiker. Für Google sind folgende vier Adressen technisch gesehen vier unterschiedliche URLs:

  • http://beispiel.de
  • http://www.beispiel.de
  • https://beispiel.de
  • https://www.beispiel.de

Wenn Ihre Website unter allen vier Varianten erreichbar ist und denselben Inhalt anzeigt, haben Sie Ihren Content gerade vervierfacht.

2. URL-Parameter und Tracking

Besonders im E-Commerce und Marketing ein riesiges Thema. Sie nutzen Parameter für Tracking (z. B. ?utm_source=facebook) oder für die Steuerung der Seite.

  • Original: beispiel.de/schuhe
  • Duplikat: beispiel.de/schuhe?sort=price_asc (Sortierung)
  • Duplikat: beispiel.de/schuhe?session_id=12345

Der Inhalt – die Schuhe – bleibt fast gleich, nur die Reihenfolge ändert sich minimal. Für den Bot ist das oft Duplicate Content.

3. Groß- und Kleinschreibung (Case Sensitivity)

Auf manchen Servern (vor allem Linux-basiert) macht es einen Unterschied, ob man Groß- oder Kleinbuchstaben nutzt.

  • beispiel.de/Kontakt
  • beispiel.de/kontakt

Wenn beide URLs erreichbar sind, haben Sie ein Duplikat.

4. Die „Druckversion“

Ein Relikt aus älteren CMS-Zeiten, aber immer noch anzutreffen. Das System generiert automatisch eine druckfreundliche Version jedes Artikels unter einer eigenen URL:

  • beispiel.de/artikel
  • beispiel.de/print/artikel

Wenn die Print-Version nicht für Suchmaschinen gesperrt ist, konkurriert sie mit dem Original.

5. Filter und Facetten-Navigation in Shops

Das ist der Endgegner für viele Online-Shops. Ein Nutzer filtert nach „Farbe: Rot“ und „Größe: 42“. Das System erstellt eine URL:

  • shop.de/hosen?color=red&size=42

Dann filtert er erst nach Größe, dann nach Farbe:

  • shop.de/hosen?size=42&color=red

Der Inhalt ist identisch, die URL ist anders. Bei Kombinationen aus Farben, Größen, Marken und Materialien entstehen so schnell Millionen von theoretischen Duplikaten.

Lösungen: Canonical vs. Noindex vs. Redirect (wann was?)

Jetzt atmen wir tief durch. Das Gute an technischen Problemen ist: Es gibt technische Lösungen. Sie müssen nicht alle Duplikate löschen. Sie müssen Google nur sagen, wie die Suchmaschine damit umgehen soll.

Wir haben drei Hauptwerkzeuge in unserem SEO-Werkzeugkasten. Die Kunst ist zu wissen, wann man welchen Schraubenschlüssel benutzt.

1. Der 301-Redirect (Die Umleitung)

Der 301-Redirect ist die sauberste Lösung, wenn Duplikate gar nicht erst existieren sollen.

  • Was er macht: Er leitet Nutzer und Bots permanent von URL A auf URL B weiter.
  • Wann nutzen:
    • Bei dem HTTP/HTTPS oder WWW/non-WWW Problem. Entscheiden Sie sich für eine Version (z. B. https://www.beispiel.de) und leiten Sie alle anderen per 301 darauf um.
    • Bei Slash/kein Slash am Ende (beispiel.de/team/ vs. beispiel.de/team).
    • Wenn Sie alte Inhalte auf neue URLs umziehen.
  • Der Effekt: Die Linkkraft wird fast vollständig auf die Ziel-URL übertragen. Das Duplikat verschwindet aus dem Index.

2. Das Canonical Tag (Das Original-Schild)

Manchmal müssen Duplikate existieren. Zum Beispiel brauchen Sie die URL mit dem Tracking-Parameter ?utm_source=newsletter, um Ihren Erfolg zu messen. Sie können diese URL nicht weiterleiten, sonst geht die Messung verloren. Hier kommt das Canonical Tag ins Spiel.

  • Was es ist: Eine Zeile im HTML-Code (<link rel="canonical" href="..." />), die Google sagt: „Diese Seite hier ist zwar nett, aber das Original findest du dort.“
  • Wann nutzen:
    • Bei Tracking-Parametern und Sortierungen in Shops.
    • Bei Produktvarianten (z. B. zeigen alle Farbvarianten per Canonical auf die Hauptvariante).
    • Bei Syndication (wenn Ihr Artikel auch auf anderen Portalen erscheint, sollten diese idealerweise per Canonical auf Sie verweisen).
  • Der Effekt: Google crawlt zwar beide Seiten, indexiert aber meistens nur das definierte Original. Die Linksignale (z. B. Backlinks auf die Parameter-URL) werden dem Original gutgeschrieben.

3. Das Noindex Tag (Das Stoppschild)

Manchmal wollen Sie, dass eine Seite existiert, aber Google soll sie komplett ignorieren.

  • Was es ist: Ein Meta-Tag (<meta name="robots" content="noindex">), das die Indexierung verbietet.
  • Wann nutzen:
    • Bei reinen Funktionsseiten, die keinen SEO-Wert haben (Warenkorb, Login, interne Suchergebnisse).
    • Bei der oben genannten Druckversion.
    • Bei Duplicate Content, den Sie schnell aus dem Index haben wollen, ohne Weiterleitungen einzurichten.
  • Der Effekt: Die Seite bleibt für Nutzer erreichbar, taucht aber nicht mehr in den Suchergebnissen auf.

Wichtig: Kombinieren Sie niemals noindex und canonical auf derselben Seite. Das verwirrt Google. Entweder Sie sagen „Nimm mich nicht auf“ (noindex) ODER „Das Original ist woanders“ (canonical).

Mini-Checkliste + Monitoring in GSC

Sie müssen kein Entwickler sein, um Duplicate Content zu finden. Die Google Search Console (GSC) liefert Ihnen die Daten frei Haus.

Schritt 1: Den Status prüfen

Gehen Sie in der GSC auf den Bericht „Seiten“ (unter Indexierung). Schauen Sie sich die Tabelle an. Suchen Sie nach folgenden Meldungen:

  • „Duplikat – vom Nutzer nicht als kanonisch festgelegt“:
    Google hat Duplikate gefunden, aber Sie haben kein Canonical Tag gesetzt. Google hat sich selbst eine Version ausgesucht. Prüfen Sie: Ist es die richtige? Wenn nicht, setzen Sie Canonicals.
  • „Duplikat – Google hat eine andere Seite als der Nutzer als kanonische Seite bestimmt“:
    Das ist spannend. Sie haben ein Canonical gesetzt, aber Google ignoriert es. Das passiert oft, wenn die Inhalte zu unterschiedlich sind oder technische Fehler vorliegen.

Schritt 2: URL-Parameter-Check

Geben Sie bei Google eine site:ihredomain.de-Abfrage ein und schauen Sie sich die Ergebnisse an. Sehen Sie viele URLs mit seltsamen Anhängseln wie ?id=, &sort= oder ?filter=? Das ist ein Indiz, dass Ihre Parameter-Steuerung nicht optimal läuft.

Schritt 3: Konsistente interne Verlinkung

Ein oft übersehener Punkt: Verlinken Sie intern immer auf dieselbe Version Ihrer URL?

  • Falsch: Mal verlinken Sie auf /kontakt, mal auf /kontakt/ und mal auf www.beispiel.de/kontakt.
  • Richtig: Entscheiden Sie sich für ein Format (z. B. immer mit Trailing Slash /) und ziehen Sie das gnadenlos durch. Jeder inkonsistente Link sendet gemischte Signale an den Crawler.

Fazit: Aufräumen lohnt sich

Duplicate Content ist keine Katastrophe, die Ihre Existenz bedroht. Aber es ist ein unnötiger Ballast, den Sie mit sich herumschleppen. Wenn Sie Ihre Website technisch sauber halten – durch korrekte Weiterleitungen, Canonicals und eine klare Struktur – machen Sie es Google leicht, Ihre Inhalte zu lieben.

Der Lohn der Mühe ist nicht nur ein besseres Gewissen, sondern vor allem:

  • Ein effizienteres Crawling (neue Inhalte ranken schneller).
  • Gebündelte Linkkraft (bessere Positionen für Ihre Haupt-Keywords).
  • Die volle Kontrolle darüber, welche Seiten Nutzer in der Suche finden.

Nehmen Sie sich die Zeit, einmal gründlich durchzukehren. Es ist wie im Supermarktregal: Wenn nur noch das eine, richtige Produkt dort steht, greifen die Kunden viel lieber zu.


Häufig gestellte Fragen (FAQ)

Ist Content Syndication (z. B. Gastbeiträge) Duplicate Content?
Technisch gesehen ja. Wenn Sie einen Artikel auf Ihrem Blog und gleichzeitig auf LinkedIn oder Medium veröffentlichen, existiert der Text zweimal. In der Regel erkennt Google das Original am Veröffentlichungsdatum. Um sicherzugehen, sollten Sie auf der externen Plattform (wenn möglich) ein Canonical Tag auf Ihren Originalartikel setzen lassen oder zumindest einen Link „Original erschienen auf…“ einfügen.

Darf ich Herstellertexte für meinen Shop nutzen?
Dürfen Sie, aber es ist aus SEO-Sicht nicht ideal. Wenn 50 andere Shops denselben Text vom Hersteller kopieren, haben Sie keinen Grund geliefert, warum Google ausgerechnet Ihre Seite ranken soll. Versuchen Sie, zumindest die ersten 1-2 Absätze individuell zu schreiben und mit eigenen Erfahrungen oder Tipps anzureichern (E-E-A-T!).

Was ist Near-Duplicate Content genau?
Das sind Seiten, die sich nur minimal unterscheiden. Beispiel: Immobilienmakler-Seiten, die für „Haus kaufen Berlin“, „Haus kaufen München“ und „Haus kaufen Hamburg“ exakt denselben Textbaustein nutzen und nur den Städtenamen austauschen. Google stuft dies oft als „Doorway Pages“ oder qualitativ minderwertigen Inhalt ein. Hier sollten Sie dringend individuelle Inhalte für die lokalen Seiten erstellen.

Was macht Google eigentlich mit Duplikaten, wenn ich nichts tue?
Google versucht, das Problem selbst zu lösen. Der Algorithmus gruppiert die Duplikate und bestimmt einen „Gewinner“ (Canonical), den er in den Suchergebnissen anzeigt. Die anderen Versionen werden in den sogenannten „Supplement Index“ (ergänzenden Index) verschoben und tauchen in der normalen Suche kaum noch auf. Das Problem dabei: Sie verlassen sich darauf, dass eine Maschine Ihren Geschäftszweck richtig errät. Besser ist es, Sie geben die Richtung