Basiswissen SEO: Was ist eigentlich WDF*IDF?
Posted on March 20, 2019 in Online Marketing
WDF*IDF stellt in der Suchmaschinenoptimierung ein häufig verwendetes Hilfsmittel zur Berechnung der Aussagekraft der eigenen Inhalte im Verhältnis zum Content anderer Webseiten dar. WDF bedeutet „Within Document Frequency“ und berechnet die Häufigkeit aller in einem Text vorkommenden Worte und bewertet diese nach Gewichtung. So berechnet der Algorithmus die Relevanz des Inhalts. IDF steht hingegen für „Inverse Document Frequency“. Dieser Wert gibt an, wie ein einzelnes Wort im Dokument für den Suchmaschinenindex gewertet wird. Dazu wird der gesamte Term in Relation zum Gesamtkorpus gesetzt.
Das heißt: Die WDF*IDF-Formel bestimmt das Verhältnis bestimmter Wörter innerhalb einer Webseite, eines Dokumentenkorpus oder eines Textdokuments zu vergleichbaren Dokumenten. Das Schema zieht die Term-Frequenz mit ein und eignet sich daher ideal für die OnPage-Optimierung. Schließlich lässt sich mit WDF*IDF die Relevanz der eigenen Webseite im Suchmaschinenindex erhöhen, ohne dass Webseitenbetreiber auf die Keyword Density allein achten müssten.
Wie wird die WDF*IDF-Formel berechnet?
Für WDF*IDF multipliziert der Algorithmus die Häufigkeit eines Wortes (j) in einem Text (k) mit der Frequenz desselben Wortes in einem vergleichbaren Dokument. So ergibt sich die Rangfolge (w) dieses Terms (j) im Dokumentenkorpus (k):
W j,k= WDF j,k * IDF j
Der Wert „WDF“, also die Abkürzung für „Within Document Frequency“, bestimmt, wie häufig ein Wort oder eine Wortkombination im Dokument vorkommt. Dieser ergibt sich wie folgt:
WDF j= log2 (Frequenz j,k + 1) / log2(L)
Der Logarithmus soll verhindern, dass eine enorme Anzahl des Hauptkeywords bei der Berechnung zu einem höheren Wert und damit zu einer besseren Platzierung führt. Die Keyword-Dichte oder Keyword Density berechnet schließlich nur die prozentuale Verteilung eines Begriffs bezogen auf die Gesamtwortzahl des Textes. Die Within-Document-Frequency hingegen bezieht auch die Relation aller im Text vorkommenden Begriffe mit ein.
Der Multiplikator IDF steht für die „Inverse Document Frequency“ und ermittelt die Dokumentenhäufigkeit. Die Term-Frequenz (t) wird dazu ins Verhältnis zur relativen Häufigkeit der übrigen Worte im Text bzw. im Dokument oder einer Webseite gesetzt. Die IDF-Formel berechnet also, wie relevant der Inhalt bezogen auf ein bestimmtes Keyword ist. So setzt sich die Berechnung zusammen:
IDF t= log (1 + ND/ ft)
Mit der Inverse-Document-Frequency bekommt der Term WDF ein wichtiges Korrektiv. Die Ermittlung der inversen Dokumentenhäufigkeit dient dazu, die Frequenz an Inhalten zu einem bestimmten Term mit einberechnen zu können. Die IDF-Formel legt die Anzahl aller bekannten Inhalte in Relation zur Zahl der Inhalte, die den gewünschten Term enthalten. Auch hier dient der Logarithmus als Hilfsmittel, denn er „staucht“ die Ergebnisse.
Beide Gleichungen miteinander multipliziert bilden die relative Termgewichtung eines Dokuments im Relation zu allen möglichen Dokumenten, die denselben Suchbegriff enthalten. Um ein wirklich aussagekräftiges Ergebnis zu erzielen, sollte die Formel für jeden sinntragenden Begriff innerhalb eines ausgewählten Textdokuments angewandt werden. Je größer die Informationsbasis für die Berechnung des WDF*IDF-Werts ist, desto genauer sind die ermittelten Ergebnisse.
WDF*IDF und der Nutzen für SEO
Wird WDF*IDF für die Suchmaschinenoptimierung verwendet, wollen User den Content ihrer Webseiten und Unterseiten gezielt einzigartig gestalten. Suchmaschinen bewerten diesen Unique Content aufgrund seiner Einzigartigkeit besser, wodurch die eigene Webseite weiter vorn in den Search Engine Result Pages (SERPs) auftaucht. Lange Zeit stand vor allem die Keyword-Dichte im Fokus. Heute gilt die WDF*IDF-Formel als Maßstab für suchmaschinenoptimierte Texte und bietet eine wesentlich präzisere Möglichkeit seinen Content zu optimieren.
Da Suchmaschinen heute mehr und mehr versuchen, auch die Bedeutung der Begriffe zu verstehen, kann es vorteilhaft sein, auch die semantischen Zusammenhänge auf der Seite zu optimieren. Dieser Vorgang gehört zur Kategorie der „Latent Semantic Optimization“.
Ein WDF*IDF-Tool kann dabei helfen, genau die Keywords zu bestimmen, die im Website-Content idealerweise verwendet werden sollten. Diese Tools unterstützen so nicht nur die Keyword-Optimierung, sondern auch die Texterstellung. Sie geben hilfreiche Hinweise darauf, welche Suchbegriffe das Dokument enthalten sollte und wie es unique bleibt.
Gibt es Nachteile bei WDF*IDF?
WDF*IDF sollte nicht als Allheilmittel in der Content-Optimierung angesehen werden. Die Formel stellt vordergründig eine mathematische Möglichkeit zur Keyword-Optimierung dar, mit der sich Inhalte einzigartig erstellen lassen. Andere Werte in der Content-Optimierung schließt die WDF*IDF-Formel jedoch aus. Dazu gehören unter anderem Signalwörter oder spezielle Nachbartermini, die auf die tatsächliche Suchintention des Anwenders schließen lassen. Die reine WDF*IDF-Formel kann so auch Nonsense-Inhalte als optimiert ansehen. Den Hilfsmitteln fehlt noch die Möglichkeit beispielsweise Mehrdeutigkeiten gezielt abzubilden bzw. mit einzubeziehen.
Zudem berücksichtigt die WDF*IDF-Formel nicht, dass Keywords in einem Absatz auch häufiger vorkommen können, dass ein Text stärker mit Synonymen arbeitet oder dass sogenannte Stemming-Regeln gelten könnten. Sollen Inhalte nur nach der Termgewichtung optimiert werden, müssen alle Elemente der Webseite in die Analyse miteinbezogen werden.
Webmaster, Texter und Marketer sollten sich beim Schreiben nicht nur auf die WDF*IDF-Kurve konzentrieren. Schließlich basieren die Ergebnisse der Tools auf Logarithmen. Andere Werte bezieht die Termgewichtung nicht mit ein. Doch spielen CTAs, Jargon, Lesefluss, Stilmittel, Struktur, Tonalität und Usability eines Textes eine wesentliche Rolle für den Leser. Die stetige Verbesserung der Algorithmen, die zunehmende Kundenorientierung und die kontinuierliche Entwicklung künstlicher Intelligenz heben die Schwachstellen der WDF*IDF-Formel, die lange Zeit als echte Geheimwaffe im SEO galt, verstärkt hervor. Bounce-Rates, Interaktionsraten wie Kommentare oder Shares und die Verweildauer spielen heute eine wesentlich wichtigere Rolle als die bloße Term-Berechnung. Damit User die Inhalte gern konsumieren, müssen auch die oben genannten Aspekte mit in den Text einfließen.
Letztlich stellt die Content-Optimierung nur einen von vielen weiteren Maßnahmen im Rahmen der OnPage-Optimierung dar. Auch ein nach WDF*IDF verfasster Text kann Rankingnachteile nicht aufwiegen, die beispielsweise durch schlechte Inhalte oder minderwertige Backlinks und einer nicht für mobile Endgeräte optimierte Webseite entstehen.
WDF*IDF für Onlineshops
Gerade bei der Optimierung von Onlineshops stehen Produktbezeichnungen und Kategorie-Überschriften bei der Term-Berechnung im Fokus. Auf Seiten, wo nur ein einzelnes Produkt beschrieben wird, ist WDF*IDF nicht die geeignete Formel für die Content-Optimierung. Produktbeschreibungen enthalten dafür zu wenig Text. Schließlich greift die WDF*IDF-Formel viel weiter und berechnet jeden einzelnen Term im Dokument.