XML-Sitemap

Picture of Ferenc Collinet
Ferenc Collinet

Du hast unzählige Stunden in die Erstellung deiner Website gesteckt. Du hast spannende Blogartikel geschrieben, detaillierte Produktseiten angelegt und sichergestellt, dass das Design perfekt aussieht. Doch dann kommt der Moment der Wahrheit: der Blick in die Google Search Console. Und was siehst du dort? Viele deiner mühsam erstellten Seiten sind gar nicht indexiert.

Die erste Reaktion vieler Website-Betreiber ist der Griff zur XML-Sitemap. „Ich muss Google einfach nur eine Liste aller meiner Seiten geben, dann klappt das schon“, ist ein weit verbreiteter Gedanke. Doch genau hier liegt oft der Hund begraben.

In der Praxis sehen wir häufig Sitemaps, die völlig überladen sind. Sie enthalten Tausende von URLs, die Google gar nicht sehen soll oder die schlichtweg keinen Mehrwert bieten. Statt Google zu helfen, sorgen solche Sitemaps für Verwirrung und verschwenden wertvolle Ressourcen. Eine unsaubere Sitemap kann sogar dazu führen, dass deine wirklich wichtigen Seiten langsamer oder gar nicht indexiert werden.

Wir zeigen dir in diesem Artikel, wie du deine XML-Sitemap von einem simplen Datenfriedhof in ein präzises Steuerungsinstrument verwandelst. Du erfährst, was hineingehört, was draußen bleiben muss und wie du typische Fehler – gerade bei WordPress – vermeidest.

Was ist eine XML-Sitemap (und was kann sie nicht)?

Um zu verstehen, warum Sitemaps oft falsch eingesetzt werden, müssen wir erst einmal klären, was sie eigentlich sind. Stell dir deine Website wie eine riesige Bibliothek vor. Deine internen Links sind die Gänge und Wegweiser, die Besucher und den Bibliothekar (Google) von einem Buch zum nächsten führen. Die XML-Sitemap hingegen ist der Kartenkatalog, den du dem Bibliothekar in die Hand drückst.

Die Hauptaufgabe der Sitemap ist die Discovery – das Entdecken.

Sie dient als Hilfsmittel für Suchmaschinen, um URLs zu finden, die sie auf normalem Wege (über Links) vielleicht übersehen würden. Das ist besonders wichtig für:

  • Ganz neue Websites, die noch wenige Backlinks haben.
  • Sehr große Websites mit tief verschachtelten Strukturen.
  • Isolierte Seiten (Orphan Pages), die versehentlich kaum intern verlinkt sind.

Was eine Sitemap definitiv nicht leistet

Viele Mythen ranken sich um die Macht der Sitemap. Räumen wir damit auf:

  1. Keine Indexierungs-Garantie: Nur weil du eine URL in die Sitemap schreibst, ist sie noch lange nicht im Google-Index. Google entscheidet basierend auf Qualität und Relevanz. Wenn eine Seite auf noindex steht, nützt auch der Eintrag in der Sitemap nichts.
  2. Kein Ranking-Booster: Eine Sitemap verbessert dein Ranking nicht direkt. Sie sorgt lediglich dafür, dass deine Seite überhaupt erst an der Startlinie steht.
  3. Kein Ersatz für interne Links: Eine Sitemap ist eine Ergänzung, kein Ersatz. Google bewertet Seiten, die häufig intern verlinkt sind, als wichtiger. Eine Seite, die nur in der Sitemap steht, aber nirgendwo auf deiner Website verlinkt ist, wird es schwer haben.

Mini-Beispiel:
Du hast eine Landingpage erstellt und reichst sie stolz über die Sitemap ein. Gleichzeitig hast du aber im Eifer des Gefechts das noindex-Tag im Quellcode vergessen zu entfernen. Das Ergebnis: Google findet die Seite zwar über die Sitemap, wird sie aber aufgrund des noindex-Befehls konsequent ignorieren.

Wir müssen unsere Erwartungshaltung also anpassen: Die Sitemap ist ein Werkzeug zur Übergabe von URLs, nicht zur Erzwingung von Rankings.

Goldene Regeln: Was rein muss (und was raus muss)

Die Qualität deiner Sitemap ist entscheidend. Google vertraut einer sauberen, gepflegten Liste mehr als einer chaotischen Ansammlung von Datenmüll. Das Ziel ist eine „High-Quality-Sitemap“. Das bedeutet: Jede URL in dieser Liste ist ein Treffer – eine Seite, die du unbedingt in den Suchergebnissen sehen willst.

Damit das gelingt, muss jede URL in deiner Sitemap strenge Kriterien erfüllen. Hier sind die goldenen Regeln:

1. Statuscode 200 OK

In deine Sitemap gehören nur Seiten, die funktionieren. URLs, die einen 404-Fehler (Seite nicht gefunden) ausgeben oder per 301 weitergeleitet werden, haben dort nichts verloren. Warum sollte Google eine Liste abarbeiten, die ins Leere führt? Das verschwendet Crawl-Budget.

2. Indexierbar

Das klingt logisch, wird aber oft übersehen. Prüfe, ob die URLs nicht durch die robots.txt gesperrt sind oder ein noindex-Tag tragen. Eine Sitemap voller noindex-Seiten sendet widersprüchliche Signale: „Bitte schau dir das an“ vs. „Bitte nimm das nicht auf“.

3. Kanonisch (Das Original)

Dies ist einer der wichtigsten Punkte. Wenn du Inhalte hast, die auf mehreren URLs erreichbar sind (z. B. Produktvarianten), nutzt du das Canonical Tag, um das Original zu markieren. Nur diese Original-URL (die kanonische URL) darf in die Sitemap. Alle Varianten, die auf das Original verweisen, müssen draußen bleiben.

4. Wertvoll für den Nutzer

Frage dich bei jeder URL: „Will ich wirklich, dass ein Nutzer über Google auf dieser Seite landet?“ Seiten mit dünnem Inhalt, leere Kategorien oder reine technische Hilfsseiten gehören nicht in den Index – und damit auch nicht in die Sitemap.

5. Keine Parameter-Varianten

URLs mit Parametern wie ?sessionid=123 oder ?sort=price_asc sind oft Gift für eine saubere Indexierung. Solche Parameter-URLs erzeugen massive Mengen an Duplicate Content. In die Sitemap gehören nur die sauberen, sprechenden URLs.

Mini-Beispiel:
Stell dir vor, du betreibst einen Shop. Dein Produkt „Laufschuh X“ ist unter /laufschuh-x/ erreichbar. Gleichzeitig gibt es eine URL /laufschuh-x/?farbe=rot, die per Canonical auf die Hauptseite zeigt. Wenn du nun beide URLs in die Sitemap packst, zwingst du Google dazu, beide zu prüfen, nur um festzustellen, dass eine davon irrelevant ist. Das ist ineffizient.

Indem du diese Regeln befolgst, signalisierst du Google: „Hier ist meine kuratierte Liste der besten Inhalte. Du kannst dich darauf verlassen.“

WordPress-Fallen: Archive, Tags, Medienanhänge

WordPress ist ein fantastisches System, aber „out of the box“ oder mit den Standard-Einstellungen mancher SEO-Plugins generiert es oft Sitemaps, die alles andere als optimal sind. Wenn du nicht aufpasst, bläht sich deine Sitemap unnötig auf.

Hier sind die typischen Fallen, in die viele tappen:

Die Tag-Hölle

WordPress liebt Tags (Schlagwörter). Wenn du für jeden Artikel fünf neue Tags erstellst, generiert WordPress fünf neue Archiv-Seiten. Diese Seiten enthalten oft nur Auszüge deiner Artikel und bieten keinen einzigartigen Mehrwert. Das ist klassischer Duplicate Content.

  • Lösung: Schließe Tag-Archive in deinem SEO-Plugin (z. B. Yoast, Rank Math) komplett aus der Sitemap aus und setze sie idealerweise global auf noindex, es sei denn, du pflegst sie redaktionell sehr aufwendig.

Datums- und Autoren-Archive

Braucht die Welt eine Seite, die alle Blogartikel aus dem „März 2019“ auflistet? In den meisten Fällen: Nein. Auch Autoren-Archive sind oft überflüssig, besonders bei Websites mit nur einem Autor (dann ist das Autoren-Archiv identisch mit der Blog-Startseite).

  • Lösung: Deaktivieren und aus der Sitemap entfernen.

Das Attachment-Problem (Medienseiten)

Dies ist eine besonders tückische Falle. WordPress erstellt standardmäßig für jedes Bild, das du hochlädst, eine eigene HTML-Seite (Attachment Page). Diese Seite zeigt nur das Bild an – sonst nichts.
Wenn du 1.000 Bilder hast, hast du plötzlich 1.000 Seiten mit „Thin Content“ in deiner Sitemap. Das verwässert die Qualität deiner gesamten Domain enorm und kann zu Soft-404-Fehlern führen.

  • Lösung: Moderne SEO-Plugins bieten eine Einstellung, um Attachment-URLs auf die Mediendatei selbst oder den zugehörigen Beitrag weiterzuleiten. Aktiviere diese Funktion unbedingt und entferne den Post-Type „Media“ oder „Attachments“ aus der Sitemap.

Paginierung

Soll Seite 2, 3 und 4 deines Blogs in der Sitemap auftauchen? Nein. Google findet diese Seiten über die internen Links („Nächste Seite“) auf Seite 1. Die Pagination in der Sitemap führt nur dazu, dass Google Zeit mit Archiv-Blättern verbringt, statt deine neuen Artikel zu crawlen.

Mini-Beispiel:
Wir haben kürzlich eine Website auditiert, die 12.000 URLs in der Sitemap hatte. Nach der Bereinigung von Attachment-Seiten, Tags und Parameter-URLs blieben 1.500 relevante Ziel-URLs übrig. Das Ergebnis: Die wichtigen Seiten wurden plötzlich viel häufiger gecrawlt und schneller indexiert, weil der „Lärm“ weg war.

Große Sites: Segmentierung & Priorisierung

Wenn deine Website wächst, wird eine einzige Sitemap-Datei schnell unübersichtlich. Google akzeptiert zwar bis zu 50.000 URLs pro Datei, aber aus strategischer Sicht ist das oft nicht sinnvoll. Hier kommt die Segmentierung ins Spiel.

Anstatt alles in einen Topf zu werfen, nutzen wir einen Sitemap-Index. Das ist quasi eine Sitemap für Sitemaps. Sie verweist auf mehrere Unter-Sitemaps.

Warum machen wir das? Wegen der Diagnose-Möglichkeiten.

Stell dir vor, du hast einen großen Online-Shop mit einem Magazin. Wenn du alles in einer Datei hast und die Google Search Console meldet „500 Fehler“, musst du mühsam suchen, wo diese liegen. Wenn du aber segmentierst, siehst du sofort:

  • sitemap-products.xml: 10 Fehler
  • sitemap-blog.xml: 0 Fehler
  • sitemap-categories.xml: 490 Fehler

Aha! Das Problem liegt also eindeutig bei den Kategorien.

Sinnvolle Segmentierungs-Strategien

  1. Nach Content-Typ: Trenne Produkte, Blogposts, statische Seiten und Kategorien. Das ist der Standard bei den meisten SEO-Plugins.
  2. Nach Aktualität: Bei großen News-Portalen oder sehr aktiven Blogs kann eine Sitemap für „Artikel 2024“ und eine für „Archiv“ sinnvoll sein. So sieht Google sofort, wo die frischen Inhalte liegen.
  3. Nach Wichtigkeit: Du kannst eine Sitemap für deine „Money Pages“ (wichtige Landingpages) anlegen, um deren Performance isoliert zu überwachen.

Priorisierung durch Updates
Der <lastmod>-Tag in der Sitemap gibt an, wann eine Seite zuletzt geändert wurde. Lange Zeit hieß es, Google ignoriere das. Mittlerweile bestätigt Google aber, dass ein korrekt gepflegtes Datum hilft. Wenn du einen Artikel aktualisierst, sollte sich das Datum in der Sitemap ändern. Das signalisiert dem Bot: „Hier gibt es etwas Neues, komm vorbei!“ Aber bitte nicht schummeln: Ein Skript, das täglich das Datum aller Seiten auf „heute“ setzt, wird von Google erkannt und ignoriert.

Quickcheck (10 Punkte) & laufende Pflege

Sitemaps sind keine „Set-and-Forget“-Aufgabe. Websites leben, URLs ändern sich, Plugins werden aktualisiert. Ein Fehler in einem Update kann dazu führen, dass plötzlich Tausende 404-Seiten in die Sitemap gespült werden.

Deshalb empfehlen wir einen regelmäßigen Check. Hier ist deine Checkliste für die monatliche Hygiene:

  1. Erreichbarkeit: Ist die Sitemap-URL in der robots.txt angegeben?
  2. Status 200: Stichproben-Check: Geben die URLs in der Sitemap wirklich Status 200 OK zurück?
  3. Keine Weiterleitungen: Sind wirklich nur die Ziel-URLs enthalten, keine 301-Redirects?
  4. Kanonisierung: Zeigen alle URLs auf sich selbst (Self-Referencing Canonical)?
  5. Exklusion: Sind Impressum, Datenschutz oder Login-Seiten (falls gewünscht) draußen?
  6. Noindex-Check: Hat sich versehentlich eine noindex-Seite eingeschlichen?
  7. Taxonomien: Sind Tags und unwichtige Archive wirklich deaktiviert?
  8. Media-Check: Sind Attachment-URLs verschwunden?
  9. Aktualität: Werden neue Beiträge sofort in die Sitemap aufgenommen?
  10. Console-Check: Was sagt der Bericht „Sitemaps“ in der Google Search Console? Gibt es Warnungen?

Mini-Beispiel für deine Routine:
Mach es dir zur Gewohnheit, nach jedem größeren Relaunch oder Plugin-Update einmal die Sitemap manuell aufzurufen oder durch einen Crawler (wie Screaming Frog) zu jagen. Es dauert nur wenige Minuten, spart dir aber im Ernstfall wochenlange Ranking-Probleme.

FAQ: Häufige Fragen zur XML-Sitemap

Muss ich meine Sitemap manuell erstellen?
Nein, um Himmels willen. Nutze ein Plugin oder dein CMS. Manuelle Listen sind nach einem Tag veraltet und eine Fehlerquelle.

Wie oft sollte die Sitemap aktualisiert werden?
Automatisch und sofort. Ein gutes CMS erledigt das in Echtzeit, sobald du auf „Veröffentlichen“ klickst.

Ist lastmod wirklich wichtig?
Ja, wenn es ehrlich ist. Es hilft Google, Crawl-Ressourcen einzuteilen. Wenn Google weiß, dass sich Seite A seit 3 Jahren nicht geändert hat, muss der Bot dort nicht so oft vorbeischauen.

Ist die Sitemap eine Garantie für Indexierung?
Wir können es nicht oft genug sagen: Nein. Sie ist eine Einladung, keine Vorladung.


Fazit: Mach deine Sitemap zum Präzisionsinstrument

Eine XML-Sitemap ist mehr als nur eine Datei, die man halt haben muss. Sie ist deine direkte Kommunikationslinie zu Google. Sie sagt: „Hier sind meine Inhalte, und zwar genau die, auf die es ankommt.“

Wenn deine Sitemap sauber, schlank und gut strukturiert ist, hilfst du Google, deine Website effizienter zu verstehen. Du vermeidest Rauschen und lenkst den Fokus auf deine wertvollen Inhalte. Und genau das ist technisches SEO in Reinform: Hindernisse aus dem Weg räumen, damit dein Content glänzen kann.

Bist du dir unsicher, ob deine aktuelle Sitemap eher hilft oder schadet? Oft schleichen sich über Jahre Fehler ein, die man selbst gar nicht mehr sieht.

Sitemap-Optimierung: Lass uns gemeinsam einen Blick darauf werfen. Wir führen einen Hygiene-Check durch, bereinigen Altlasten und sorgen dafür, dass deine Sitemap wieder ein echter Wegweiser für deinen Erfolg ist.