10
Dez

PDF als „Duplicate Content“ gut oder schlecht?

   Posted by: SEO-Xplorer   in Werkzeuge

Kürzlich bin ich auf Tabbloid ein online Werkzeug gestossen, dass automatisch RSS Feeds empfängt und dann daraus ein PDF-Dokument macht und wieder zurück mailt. (Danke dafür Eoin O’Leary von der irischen Internet Marketing Clinic).

Das PDF is wirklich schön in einem 2-Spalten Layout aufbereitet, sogar die Grafiken werden passend eingebettet…

So weit so gut. Aber wofür soll das gut sein?

Niun, mir wurde vorgeschlagen, das PDF als Service für die Leser wieder auf die Website zu stellen (Gut, klar!) und dass es auch noch den Website Rankings helfen soll (Hä?).

Nun, da wir ja nun zur Genüge wissen, dass es keine explizite Bestrafung für doppelten Content gibt, so hab‘ ich immer noch geglaubt, dass doppelter Content mir bzw. meiner Website schaden könnte, da die Suchmaschinen eine Version auswählen müssten und die anderen ignorieren würden, und dadurch die Rankingfähigkeiten geschwächt würden, da die Gewichtung über die verschiedenen Versionen verteilt würde. Naja, da hab‘ ich wohl etwas schief gelegen – zumindest was Google betrifft. Google sammelt doch tatsächlich die Ranking Kraft aller „Duplicate Content“ Seiten/Versionen und schmeisst sie zusammen in einen Topf, um dann einen gemeinsamen Relevanz-Faktor zu berechnen, und dann sucht Google eine Seite/Version aus um diese gesamte Gruppe in den Suchergebnissen zu vertreten.(Siehe >Die „Duplicate Content-Penalty“ – entmystifiziert!< auf Google’s Webmaster Zentrale Blog vom 12. Sept. 2008)

Andererseits empfiehlt Matt Cutts selbst eine Version zu bevorzugen, und die anderen Versionen von der Indizierung auszuschliessen: „…it’s helpful to try to pick one of those articles and exclude the other version from indexing, …“ (siehe seinen Blogpost >Duplicate content question< vom 1. Feb. 2008).

Zuerst einmal widersprechen sich diese beiden Aussagen. Aber was machen wir jetzt daraus, besonders wenn wir uns auf den Titel dieses Posts zurück besinnen?

Gehen wir zunächst davon aus, dass der Blogpost der Webmaster Zentrale der jetzt gültige ist (er ist ja auch schließlich über sieben Monate jünger 🙂 ), UND dass Google wirklich die PDF version als doppelten Content der HTML Version erkennt und die Beiden für die Rankingberechnungen zusammen gruppiert. – Das gegeben sollte es eigentlich keinen Unterschied machen, ob wir das PDF Dokument jetzt explizit von der Indizierung ausschließen oder nicht. Es sei denn, dass das PDF-Dokument zusätzliche externe (und vielleicht auch interne) Links erhält. Mit zusätzlichen Links meine ich jetzt Sites/Seiten die nicht schon auf die HTML Version verlinken…

Nun, ich weiss jetzt wirklich nicht, ob es das Risiko wert ist, dass die Ranking Stärke potentiell über mehrere URLs verteilt wird, da Google das PDF nicht zur (richtigen) Gruppe hinzuzählt. Und falls, dann bleibt immer noch die Frage ob Tabbloid dann wirklich das Werkzeug der Wahl für diesen Zweck darstellt…

Gut, ich experimentiere momentan genau anders herum: Ich habe ein paar Feeds, die ich gerne lesen würde, aber immer wieder irgendwie vergesse zu lesen, zu Tabbloid hinzugefügt – Ich muss nämlich zugeben, dass ich ein schrecklich schlechter Feed-Leser bin… So versuche ich also mich so zum Lesen zu bringen 🙂

Ich halte auf dem Laufenden, wie’s klappt… also a) mit Tabbloid und b) mit mir 🙂

Dieser Post ist eine Übersetzung meines Posts auf seoxplorer.com: >PDF als „Duplicate Content“ gut oder schlecht?< – Eoin O’Leary hat mir hieraufhin bereits einen Kommentar hinterlassen, den ich hier jetzt gerne noch (übersetzt) anfügen möchte:

„Hallo,

Danke für die Erwähnung, es ist toll zu sehen wie Twitter funktioniert.

Vom meinen Erfahrungen mit PDFs (aber nicht direkt mit Tabbloid), habe ich einen Sprung nach vorne in den Rankings der HTML-Version beobachten können, wenn ich den Empfehlungen vom 1. Feb. gefolgt bin.

1) Verteile Deine Artikel (PDFs) nicht überall hin.

Meine Empfehlung, Submitte nur bei deinen Haupt „Syndication“ Websites.

In anderen Worten, die „Syndication“ Websites, die Dir die besten Ergebnisse liefern.

2) Stelle sicher, dass Du einen Link zu Original-Content einbaust.

Ich füge einen Link zur HTML-Version am Ende eines jeden PDFs hinzu.

Wenn man Tabbloid benutzt, was ich auch erst angefangen habe zu testen, muss man das PDF editieren um den Link zum HTML hinzu zu fügen, da die Links alle zurück zum RSS-Feed sind.

Grüße
Eoin“

Tags: , , ,

This entry was posted on Mittwoch, Dezember 10th, 2008 at 23:12 and is filed under Werkzeuge. You can follow any responses to this entry through the RSS 2.0 feed. Both comments and pings are currently closed.

Comments are closed at this time.