Alles und jeder verwendet PDF-Dateien im privaten als auch beruflichen Alltag. Wenig verwunderlich ist es daher, dass auch die größte Suchmaschine (Google) PDF-Dateien neben anderen nicht HTML-Dokumenten wie Präsentationen oder Tabellen bereits seit dem Jahr 2001 indexiert. (Quelle: Google) Ähnlich wie normale HTML-Seiten für Suchmaschinen optimiert werden können, lassen sich auch PDF-Dokumente für eine bessere Auffindbarkeit optimieren (PDF SEO).
In der Praxis werden PDFs im SEO-Kontext häufig leider nicht ausreichend berücksichtigt, da Sie meist bei der Erstellung der Seite nicht beachtet oder erst im Nachhinein hinzugefügt werden. Die Folge sind indexierte PDF´s, deren Potential insbesondere für die Google-Suche nicht vollständig ausgeschöpft wird.
Vielleicht nutzt Du bereits selbst PDF-Dateien auf deiner Website. In diesem Fall ist der folgende Artikel besonders interessant für Dich. Im Folgenden kläre ich zunächst die Frage, ob PDF-Dateien aus Sicht der Suchmaschinenoptimierung (SEO) sinnvoll sind, wie sie für die Suchmaschine optimiert werden können und nicht zuletzt wie sich die Zugriffszahlen deiner PDF-Dateien tracken lassen.
Sind PDF´s aus SEO Sicht überhaupt sinnvoll?
Aus SEO-Sicht eignen sich PDF-Dateien grundsätzlich eher weniger, um damit langfristig gute Rankings und eine hohe organische Sichtbarkeit zu erzielen. Wer also mit einem PDF die Absicht hat, die Spitze der Suchergebnisse zu erklimmen, sollte dies zuvor noch einmal überdenken. Warum? – PDF Dateien bieten zwar im Büroalltag einige Vorteile, bringen aber insbesondere im SEO-Kontext einige Nachteile mit sich.
Ob PDFs für Dein Projekt sinnvoll sind oder eher nicht, hängt stark vom Einzelfall und der Verwendungsart ab. Grundsätzlich lässt sich sagen, dass PDF-Dateien nur dann verwendet werden sollten, wenn es dem Nutzer einen Mehrwert bietet oder für den konkreten Anwendungsfall besonders geeignet ist. Typische Fälle für die Nutzung von PDFs auf einer Website können beispielsweise Whitepaper, E-Books oder etwa Bedienungsanleitungen sein. Welche der wichtigsten Vor- und Nachteile Du bei der Frage zur Verwendung von PDFs grundsätzlich berücksichtigen solltest, zeigen wir Dir im nächsten Kapitel.
Vorteile / Nachteile von PDFs im SEO-Kontext
Vorteile von PDFs:
Konsistenz und Einheitlichkeit
PDF-Dateien sind über alle Geräte hinweg einheitlich. Jedes PDF-Dokument sieht geräteübergreifend (ob Tablet, PC oder Handy) gleich aus und hat dasselbe Erscheinungsbild.
PDFs als Linkable Asset
PDFs mit wertvollen Inhalten sind meist gern verlinkte Inhalte. Während einige Seitenbetreiber eher zögerlich auf andere Webseiten verlinken, ist die Hemmung externe PDF-Dateien zu verlinken, meist nicht so hoch. PDFs können Dir daher als Linkköder (Linkable Asset) dienlich sein und deine OffPage SEO-Bemühungen unterstützen.
Nachteile von PDFs:
Schlechte Nutzerinteraktion
PDFs bieten eine schlechte Nutzerinteraktion und Usability. Was eigentlich als Vorteil der PDFs gilt, kommt hier wiederum als Nachteil zum Tragen: Die Konsistenz. Denn insbesondere auf kleineren Mobilgeräten kann dem ein oder anderen Nutzer dies zum Verhängnis werden. Mobil-optimierte PDF-Dateien gibt es schlichtweg nicht. Auch die Navigation wird für Nutzer fast unmöglich, da die einzige Form der Navigation interne Verlinkungen aus dem Dokument heraus sind. Auch aus Conversion-Sicht ergibt sich das ein oder andere Problem, schließlich würde wohl niemand auf die Idee kommen, bezahlte Werbeanzeigen (bspw. Suchmaschinenwerbung, SEA) auf PDF-Dokumente als eine Art Landingpage zu schicken.
Tracking nur bedingt möglich
Die meisten Tracking-Tools die JS (JavaScript) basiert arbeiten, können Zugriffe oder Benutzerinteraktionen auf einem PDF-Dokument nicht erfassen. In den meisten Fällen sind PDF-Dateien daher schwarze Löcher für Webmaster. Mit anderen Worten: Deine PDF- Dateien können zwar ausreichend für Suchmaschinen optimiert sein, werden aber eventuell noch nicht erfasst.
Aber: Für diese Problem gibt es Abhilfe, worauf am Ende des Artikels eingegangen wird.
Verwendung von Link-Attributen unmöglich
Die Verwendung von Link-Attributen ist auf normalen Webseiten bzw. HTML-Dokumenten gerade bei der OffPage Optimierung selbstverständlich. Nicht hingegen in PDFs – hier lassen sich Attribute für externe Links, wie “nofollow”, “ugc”, oder “sponsored”, die im normalen SEO-Gebrauch selbstverständlich sind, nicht verwenden. Lediglich der Ankertext des externen Links kann noch beeinflusst werden.
Wie behandelt Google PDF-Dokumente?
Grundsätzlich sind PDFs aus SEO-Sicht recht unproblematisch. Sie werden zunächst (wenn möglich) von Suchmaschinen durch Webcrawler (Google) analysiert und anschließend in ein HTML Format konvertiert und so dem Nutzer bereitgestellt. In den SERPs der Suchmaschinen erscheinen PDF-Dateien grundsätzlich immer mit dem “PDF” Tag, rechts neben der URL.
Im Grunde werden PDF-Dateien ähnlich wie “normale” HTML basierte Seiten behandelt, wobei angemerkt werden muss, dass Google die HTML-Version bei einem Duplikat stets bevorzugt. Auch Links aus einem PDF werden laut Garry Illyes und John Müller normal gewertet und übertragen demnach Pagerank. Dies bestätigt zudem ein FAQ Beitrag von Google zum Thema PDF SEO. Google ist es zudem möglich, Inhalte von Bildern mittels OCR Algorithmus (Optical Character Recognition) zu erkennen. So ist Google unter anderem in der Lage, die Relevanz von Bilddateien in der Bildersuche zu bestimmen.
In Puncto Bilder-SEO haben wir beim OMT einen spannenden Artikel vom Gründer der Plattform, Mario Jung:
Wie Google PDF-Dateien behandelt, und welche Best Practices es im Hinblick auf SEO gibt, beantwortet Matt Cutts in einem Video veröffentlicht auf dem YouTube-Kanal der Google Search Central:
Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenPDF-Dateien optimieren: So geht´s
1. Notwendigkeit und Sinnhaftigkeit überdenken
Bevor Du mit der Optimierung der PDF-Dateien startest, solltest Du dir (wie Eingangs erwähnt) die Frage stellen, ob deren Verwendung wirklich sinnvoll bzw. notwendig ist. Sollte es unausweichlich oder in Deinem konkreten Fall durchaus sinnvoll und im Sinne des Nutzers sein, PDFs zu verwenden, kannst Du dich den nachfolgenden Schritten widmen. Andernfalls macht es für die Optimierung ggf. mehr Sinn, die Inhalte des PDFs in HTML-Form als Unterseite deines Projektes bereitzustellen.
2. Dateinamen für jeweiliges Keyword optimieren
Simpel, aber effektiv, ist es, den Dateinamen bzw. Dokumententitel für das jeweilige Keyword zu optimieren. Im Klartext: Benenne die Datei möglichst aussagekräftig und verwende idealerweise das Hauptkeyword passend zum Dokument. Der Dateiname ist später zwangsläufig Teil der URL und damit Rankingfaktor für Suchmaschinen wie Google.
1. Klicke dazu auf: Dokument speichern -> Speichern unter.
2. Ändere den Dateinamen
3. Inhalt optimieren und Zwischenüberschriften nutzen
Selbstverständlich für jede Art von Suchmaschinen Optimierung (SEO) sind gute und werthaltige Inhalte. Abgesehen davon sollten (ähnlich wie bei einer HTML-Seite) Zwischenüberschriften, Bildunterschriften und relevante interne Verlinkungen genutzt werden. Wichtig zu beachten ist jedoch, dass jede Art von Textinhalt auch wirklich auswählbarer Text (Plain Text) ist, welcher nicht als Bild eingebettet ist. Scans aus dem Drucker sind nicht die Art von Dokument, die Du verwenden solltest. Auch wenn es Google möglich ist, Text in Bildern mittels OCR Technologie wie eingangs erwähnt auszulesen, ist es schließlich nicht Ziel der Optimierung, es Google unnötig schwer zu machen.
4. Relevante und passende Alt-Tags für Bilder hinterlegen
Nicht nur der Text, sondern auch die Bilder lassen sich ähnlich wie auf einer herkömmlichen Seite optimieren. Beispielsweise lassen sich Bilder über den Acrobat Reader mit Alt-Tags versehen, welche Google zusätzliche Informationen zum Bild liefern. Sinnvoll sind grundsätzlich auch Bildunterschriften, die das Dargestellte näher erläutern.
5. Title- und Meta Tag im Adobe Reader hinterlegen
Ist der PDF-Inhalt an sich optimiert, können Meta-Daten wie etwa der Titel und die Beschreibung des Dokumentes in den Dokumenteneigenschaften bearbeitet werden. Diese erscheinen später in den SERPs als Title bzw. als Meta-Description.
- Klicke hierzu auf: Datei -> Eigenschaften
- Hier lassen sich Titel und Beschreibung ändern
6. PDF komprimieren und für schnelle Webanzeige optimieren
Auch wenn das PDF-Format für einige Geräte nicht unbedingt handlich ist, sollte man den Lesern zumindest eine gute Benutzerfreundlichkeit im Sinne einer schnellen Ladezeit gewährleisten. Die Optimierung der Ladezeit ist relativ simpel: Mit Online-Tools wie smallpdf.com lassen sich PDF-Dokumente mit nur einem Mausklick komprimieren. Beim Export bzw. dem Speichern der PDF-Datei sollte beispielsweise im Adobe Acrobat Reader die Funktion “Optimierung für Webanzeige” verwendet werden. Zu finden ist diese unter:
Datei -> Einstellungen -> Dokumente -> “Speichern unter optimiert für schnelle Webanzeige”
PDF SEO-Checkliste
Nutze folgende Checkliste als Orientierung für die Optimierung deiner PDF-Dateien:
- Ist die Verwendung des PDF-Formates wirklich sinnvoll?
- Ist der Dateiname von meinen PDF-Dokumenten aussagekräftig und auf ein Keyword ausgerichtet?
- Ist der Inhalt mit Zwischenüberschriften untergliedert?
- Besitzen die verwendeten Bilder einen aussagekräftigen Alt-Tag?
- Sind Titel und Beschreibung hinterlegt (Title & Meta-Description)?
- Ist das PDF komprimiert und wenn möglich für schnelle Webanzeige optimiert?
Wie Du mit bereits vorhandenen/indexierten PDFs umgehen kannst
Wie Du einzelne PDF-Dateien optimierst, haben wir also bereits thematisiert. Wie geht man aber generell idealerweise mit PDF Dateien um, die bereits indexiert sind? Verwendest Du bereits PDFs für dein Projekt, so ist folgende Vorgehensweise sinnvoll:
Vorab: Bist Du dir unsicher, ob Du PDF-Dateien auf deiner Website verwendest oder ob diese indexiert sind, nutze folgenden Suchoperator, der es Dir leicht macht bereits indexierte PDFs deiner Domain ausfindig zu machen:
site: www.musterdomain.de filetype: PDF
Sind PDFs auf deiner Domain crawlbar und bereits in Suchmaschinen indexiert, macht es zunächst Sinn deren Rankings zu prüfen. Entweder mit einem SEO-Tool (Ahrefs, Sistrix, SemRush oder Ryte) deiner Wahl oder aber direkt über die Google Search Console mit einem Filter. Lohnenswert sind selbstverständlich Rankings zu Keywords mit dementsprechend hohem Suchvolumen.
Natürlich gibt es noch weitere SEO-Tools, die einen Blick sind. Wir haben sie für Dich in unserem Tool-Vergleich festgehalten:
Haben Deine PDFs bereits ohne explizite Optimierung vergleichsweise gute Rankings, hast Du vermutlich soeben eine Traffic-Quelle gefunden, welche Dir unter Umständen aufgrund des mangelnden Trackings von PDFs bislang noch nicht in Tools wie Google Analytics aufgefallen war.
Abhängig von den Rankings ist mitunter auch die Frage der Sinnhaftigkeit der PDFs.
Entweder Du entscheidest dich dazu, die PDF-Dateien komplett aus dem Index zu entfernen oder aber Du entscheidest dich dazu, die Inhalte des PDFs per HTML als Unterseite Deiner Website bereitzustellen. So löst sich zum einen das Problem des Trackings als auch der Nutzerfreundlichkeit.
PDF-Inhalt auf einer HTML Seite bereitstellen
Entscheidet Du dich dazu, die PDFs dennoch weiterhin parallel zu den neu entstandenen Unterseiten im Index zu belassen, ist es wichtig, das PDF mit einem entsprechenden Canonical Tag zu versehen, um die Gefahr von Duplicate Content zu vermeiden und Suchmaschinen wie Google zu signalisieren, bei welchem der Dokumente es sich um das Original handelt. Dies kann beispielsweise dann Sinn machen, wenn Du dem Nutzer einen längeren Beitrag zusätzlich als PDF zum Download anbieten möchtest.
Da es in einer PDF-Datei nicht wie in einem HTML Dokument möglich ist, einen Canonical Tag im Quellcode selbst zu hinterlegen, muss hier die .htaccess des Apache Webservers herhalten. In der .htaccess kann mittels weniger Zeilen Code ein Canonical Tag auch für PDF-Dokumente hinterlegt werden. Programmierkenntnisse sind hierfür nicht zwingend notwendig, lediglich ein gutes technischen Verständnis. Folgender Code kanonisiert (passend zum oben genannten Fall) die HTML Version.
<IfModule mod_expires.c>
<Files test.pdf>
Header append Link “<https://www.musterdomain.com/die-bevorzugte-version/>; rel=\”canonical\””
</Files>
</IfModule>
Einen weiterführenden Artikel hierzu findest Du hier: www.indexlift.com
PDF-Dateien komplett aus dem Index entfernen
Die zweite der oben angesprochenen beiden Möglichkeiten, ist es PDF-Dateien komplett aus dem Index zu sperren. Dies kann dann Sinn machen, wenn die Inhalte der PDF keinen wirklichen Mehrwert liefern oder sich ohnehin nicht im Index befinden sollten. Dabei gibt es verschiedene Möglichkeiten, die Indexierbarkeit von PDF-Dokumenten zu steuern. Entweder man löscht Sie vom Server, sollten Sie gar nicht mehr online abrufbar sein oder man sperrt Diese für Crawler über die robots.txt Datei. Der einfache Befehl: „Disallow: *pdf“ reicht aus, um es etwa dem Google Crawler zu verbieten, PDF-Dokumente abzurufen, was darin resultiert, dass Diese nicht mehr indexiert werden können.
Entscheidungshilfe für den Umgang mit PDF-Dateien
Wie Du PDFs dennoch tracken kannst
Möglichkeit 1: PDF einbetten
Anstelle das PDF selbst indexieren zu lassen, kann dies auf der Website ebenso per Javascript oder als iframe eingebettet werden. So greift das herkömmliche Tracking deiner Seite und alle Zugriffszahlen können wie gehabt ausgewertet werden.
Möglichkeit 2: Tracking per Linkklick (Event basiert)
Für jeden Klick auf einen Link, welcher zum PDF führt, lässt sich ein Event einrichten, welches die Zugriffszahlen eines Dokumentes über den Link an Google Analytics sendet.
Möglichkeit 3: Protokoll des Servers
Jede PDF-Datei liegt zwangsläufig auf einem Server, über welchen sich die Zugriffszahlen auf das Dokument abrufen lassen.
Möglichkeit 4: Externe Tools
Wie oft das PDF über die Organische Google-Suche aufgerufen wurde, lässt sich mit externen Tools, aber auch mit der Google Search Console nachvollziehen.
Fazit / Zusammenfassung:
PDF-Dateien sind zwar aus Sicht der Suchmaschinenoptimierung (SEO) an sich erst einmal unproblematisch, sollten aber immer nur dann zum Einsatz kommen, wenn es wirklich sinnvoll ist. Andernfalls verschwendet man unter Umständen organischen Traffic, wertvolle Conversions oder steht sich mit Duplicate Content womöglich selbst im Weg.
Sollte es in Deinem Fall wirklich Sinn ergeben, PDF-Dateien im Google Index zu verwenden, sollten diese entsprechend den oben genannten Schritten optimiert sein.
Sind bereits viele PDFs wissentlich oder unwissentlich in Google indexiert, sollte es in Betracht gezogen werde, Diese in Seiten umzuwandeln. Die Entscheidung, ob man Inhalte eher per PDF anstatt Sie auf herkömmlichen Wege per HTML bereitzustellen, muss jedoch jeder für sich selbst entscheiden. Ein guter Anhaltspunkt zur Entscheidung, ob PDF- Dokumente sich eignen, ist die Suchintention der Nutzer. Bieten PDFs für die jeweilige Suchintention einen größeren Mehrwert gegenüber einer “normalen” HTML Seite oder nicht?
Für alle, die sich noch tiefgehender mit dem Thema PDF SEO beschäftigen wollen, ist das folgende Webinar von Stefan Godulla interessant:
Die grundlegenden Fakten rund um die Optimierung deiner PDFs für Google sind Dir jetzt klar – mit uns findest Du die passende SEO Agentur oder Google Agentur, die Dir hilft, Deine gesamte Strategie effektiv umzusetzen und Deine Ziele zu erreichen. Finde in unserem Agenturfinder die passende Agentur für Dein Unternehmen.
Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr Informationen
Hallo OMT-Team,
für den Fall, dass jemand Canonical-Tags für ein oder mehrere PDFs erstellen will, habe ich einen Code-Generator erstellt. Einfach eine Excel-Datei mit den URLs der PDFs und den URLs der Canonical-Ziele hochladen und “Generate” klicken. Das Tool stellt den Code für Apache- und Nginx-Server bereit. Ich kann mir vorstellen, dass das für manche eurer Leser:innen eine Vereinfachung ist:
https://tinyweb.com/pdf-header-canonical-generator