WDF*IDF

Bei WDF*IDF handelt es sich um eine Formel, mit welcher sich das Verhältnis bestimmter Wörter innerhalb eines Textdokuments oder einer Webseite im Vergleich zu sämtlichen potenziell vorhandenen Dokumenten berechnen lässt. Angewendet wird die Formel bei der SEO im Rahmen der OnPage-Optimierung. Auf diese Weise lässt sich das Ranking in Suchmaschinen positiv beeinflussen, ohne dass der Keyworddichte eine besondere Bedeutung zukommt.

Wichtige Begriffe bei WDF*IDF

Bei der Suchmaschinenoptimierung mittels WDF*IDF kommen Nutzer mit zwei wichtigen Begriffen in Berührung:

  • Termfrequenz: Ein wichtiges Kriterium ist die Häufigkeit eines Worts bzw. einer Wortkombination (auch Term genannt) innerhalb eines Dokuments. Hier gestaltet sich die Berechnung sehr simpel, ohne dass eine Aussage über dessen Qualität getroffen werden kann. Bei einem Text mit 2000 Wörtern über eine Versicherung kann das Wort Unfall beispielsweise fünfmal vorkommen und dennoch hat die betreffende Webseite keinen Bezug zum Thema Unfall. Im Gegenzug ist ein Text mit 20 Wörtern und zweimal dem Wort Unfall möglicherweise deutlich relevanter.
  • Keyword-Density: Die Keyworddichte hat in diesem Bereich eine etwas höhere Aussagekraft. Sie gibt die Häufigkeit eines bestimmten Wortes oder einer Wortkombination im Bezug auf die gesamte Zahl aller Begriffe. Die Formel hierfür lautet: Häufigkeit*100/Gesamtzahl der Wörter eines Dokuments. Beim ersten Beispiel ergäbe sich folglich eine Keyworddichte von 0,25 Prozent und beim zweiten von 40 Prozent. Das Problem dabei ist, dass sich die Keyword-Density relativ leicht manipulieren lässt. Zudem ist es nicht sehr logisch, der Keyworddichte eines häufig vorkommenden Wortes wie “Versicherung” dieselbe Bedeutung zukommen zu lassen als dem selten vorkommenden Begriff “Risikoausgleichskollektiv”.

WDF (Within Document Frequency)

Die Abkürzung WDF steht für Within Document Frequency. Hierbei wird ermittelt, wie relativ oft ein Wort oder eine Kombination von Wörtern innerhalb eines Textes vorkommt. Die Formel hierfür beinhaltet gleich zwei Algorithmen und wirkt auf den ersten Blick sehr kompliziert.

WDF Formel

WDF(i) = log2(Freq(i,j) + 1) / (log2(L)

Ohne Berücksichtigung der durch die Algorithmen entstehenden mathematischen Komplexität ist die Aussage der WDF relativ simpel. Es handelt sich hierbei um die durch den Logarithmus gestauchte Keyword-Density. Auf diese Weise lassen sich Texte unterschiedlicher Länge miteinander vergleichen. Extreme Werte haben dabei keine so starke Bedeutung und der Wert kann anschließend mit IDF multipliziert werden.

Zu beachten ist, dass der WDF nicht für das eigentliche Keyword, sondern für jedes relevante Wort berechnet wird. So ergibt sich am Ende eine übersichtliche Liste, welche Begriffe den Text am stärksten beschreiben. Die Webseite wird auf diese Weise deutlich besser beschrieben.

WDF Beispiel

WDF Analyse für die Seite https://www.seoagentur.de/seo-lexikon/u/usp-unique-selling-proposition/ (Quelle: seorch.de)

IDF (Inverse Document Frequency)

Mittels IDF wird die Formel zur Gewichtung der Terms komplettiert. Berechnet wird damit die “inverse document frequency” also die Dokumentenhäufigkeit. Dies ist wichtig, weil damit auch die Dokumentenhäufigkeit zu einem Wort in die Berechnung miteinbezogen wird. Mit Hilfe der IDF wird die Zahl von sämtlichen bekannten Dokumenten ins Verhältnis zu den Dokumenten gesetzt, welche den Term enthalten. Wie bei WDF wird auch hier ein Logarithmus zur Stauchung der Ergebnisse eingesetzt. Die Formel hierfür sieht wie folgt aus:

IDF Formel

IDFt = log (1 + ND) / ft

Nun wird deutlich, dass sich mit IDF die Relevanz des Textes bezüglich eines bestimmten Keywords ermitteln lässt.

Berechnung WDF*IDF

Bei WDF*IDF werden nun die beiden Formeln miteinander multipliziert. Als Ergebnis steht dabei die relative Termgewichtung des Dokumentes im Verhältnis zu sämtlichen vorhandenen Dokumenten mit demselben Keyword. Um das bestmögliche Ergebnis zu erzielen, muss die Formel WDF*IDF auf alle relevanten Wörter in einem Text angewendet werden. Je mehr Daten in eine WDF*IDF Optimierung einfließen, desto genauer ist das Ergebnis.

Dank der mathematischen Komponente steht am Ende eine Liste sämtlicher Wörter mit den zugehörenden Zahlen. Dabei gelten die folgenden Regeln:

  • Den höchsten Wert haben Worte die im Text relativ häufig, grundsätzlich jedoch nur selten vorkommen.
  • Oft verwendete Worte, die auch im Text häufig vorkommen haben einen geringen Wert.
  • Begriffe, welche im Text und auch sonst eher selten sind besitzen einen mittleren Wert.

Bedeutung von WDF*IDF für die SEO

Bei der Suchmaschinenoptimierung erfolgt die WDF*IDF Analyse mittels spezieller Tools. Das Ziel liegt darin, die Webseite bzw. deren Unterseiten möglichst einzigartig zu gestalten. Webseiten mit einzigartigen Inhalten werden von Suchmaschinen höher bewertet, was bei Anfragen zu einem besseren Ranking führt.

Vor der Zeit von WDF*IDF galt vor allem die Keyword-Density als wichtiges Kriterium bei Suchmaschinen. Dies hat sich mittlerweile jedoch geändert. Für die Optimierung stellt WDF*IDF eine deutlich präzisere Möglichkeit dar.

Suchmaschinen wie Google legen beim Ranking einen immer größeren Wert auf den semantischen Zusammenhang der verwendeten Begriffe. Deshalb ist es wichtig, die SEO ebenfalls semantisch zu konzipieren. In der Praxis wird diese Vorgehensweise auch als Latent Semantic Optimization bezeichnet.

Mit einem entsprechenden WDF*IDF Tool können Nutzer das ideale Keyword für ihr Dokument ermitteln. Dazu gibt eine solche Software wichtige Hinweise, welche Terms neben dem eigentlichen Keyword ebenfalls enthalten sein sollten.

Kritik an WDF*IDF optimierten Texten

Die Optimierung von Webseiten mittels WDF*IDF hat jedoch nicht nur Vorteile. Bei Experten gibt es dafür auch Kritik. Bei der Nutzung von entsprechenden Tools sollte man sich klaren sein, dass sämtliche Elemente einer Website dabei berücksichtigt werden. Hierzu gehören auch die Produktbeschreibungen in Online-Shops sowie Überschriften von Kategorien. Wird auf einer Seite lediglich ein einzelnes Produkt beschrieben, ist die WDF*IDF Formel nicht die geeignete Lösung. Diese Variante der OnPage-Optimierung ist in erster Linie für Seiten mit langen Texten gedacht. Dies liegt in erster Linie daran, dass die Formel den Wert jedes einzelnen Term eines Dokuments berechnet.

Ein weiteres Problem ist, dass dabei nicht berücksichtigt wird, dass Begriffe innerhalb eines Absatzes gehäuft vorhanden sein können oder dass der Verfasser mit Synonymen gearbeitet hat.

Bei der WDF+IDF Formel handelt es sich also keineswegs um ein Wundermittel, für ein besseres Ranking. Es stellt vielmehr ein nützliches Hilfsmittel dar, mit dem Texte einzigartiger gestaltet werden können. In der Praxis wird selbst der bestens optimierte Text nicht die gewünschte Wirkung erzielen, wenn darin schlechte Backlinks enthalten sind oder sich die Seite auf mobilen Geräten nicht ordentlich anzeigen lässt.

IDF Formel

Webmaster und Texter sollten sich beim Verfassen deshalb ausschließlich an der WDF*IDF Formel orientieren. Man sollte jederzeit im Hinterkopf haben, dass es sich hier nur um Berechnungen auf Basis von Logarithmen handelt. Weitere ebenfalls wichtige Kriterien wie Lesbarkeit, Struktur oder Tonalität werden bei der Analyse überhaupt nicht berücksichtigt. Für einen wirklich guten Text sind diese Komponenten jedoch ebenso wichtig.

Weiterführende Links:

https://www.ionos.co.uk/digitalguide/online-marketing/web-analytics/wdfidf-the-formula-for-better-content/

 


Sie haben noch Fragen?

Kontaktieren Sie uns

Free Account erstellen


Weitere Inhalte