Zipfsches Gesetz

Autor: Leandro Alegsa

03-11-2020 00:00

Das Zipf-Gesetz ist ein empirisches Gesetz, das mit Hilfe mathematischer Statistik formuliert wurde, benannt nach dem Linguisten George Kingsley Zipf, der es als erster vorgeschlagen hat.

Das Zipf-Gesetz besagt, dass bei einer großen Stichprobe von verwendeten Wörtern die Häufigkeit eines jeden Wortes umgekehrt proportional zu seinem Rang in der Häufigkeitstabelle ist. Die Wortzahl n hat also eine Häufigkeit, die proportional zu 1/n ist.

So wird das häufigste Wort etwa doppelt so oft vorkommen wie das zweithäufigste Wort, dreimal so oft wie das dritthäufigste Wort usw. In einer Stichprobe von Wörtern in der englischen Sprache beispielsweise macht das am häufigsten vorkommende Wort, "the", fast 7% aller Wörter aus (69.971 von etwas mehr als 1 Million). Getreu dem Zipfschen Gesetz macht das zweithäufigste Wort "von" etwas mehr als 3,5% der Wörter aus (36.411 Vorkommen), gefolgt von "und" (28.852). Es werden nur etwa 135 Wörter benötigt, um die Hälfte der Stichprobe von Wörtern in einer großen Stichprobe zu erfassen.

Dasselbe Verhältnis findet sich in vielen anderen Rankings, die nicht mit der Sprache zusammenhängen, wie z.B. die Bevölkerungszahlen von Städten in verschiedenen Ländern, Unternehmensgrößen, Einkommensranglisten usw. Das Erscheinen der Verteilung in den Ranglisten der Städte nach Einwohnerzahl wurde erstmals 1913 von Felix Auerbach bemerkt.

Es ist nicht bekannt, warum das Zipf-Gesetz für die meisten Sprachen gilt.

Fragen und Antworten

F: Was ist das Zipfsche Gesetz?

A: Das Zipf'sche Gesetz ist ein empirisches Gesetz, das besagt, dass die Häufigkeit eines Wortes in einer großen Stichprobe umgekehrt proportional zu seinem Rang in der Häufigkeitstabelle ist.

F: Wer hat das Zipf'sche Gesetz vorgeschlagen?

A: Das Zipfsche Gesetz wurde erstmals von George Kingsley Zipf, einem Linguisten, vorgeschlagen.

F: Wie erklärt das Zipf'sche Gesetz die Worthäufigkeit in einer Stichprobe von englischen Wörtern?

A: Nach dem Zipf'schen Gesetz kommt das häufigste Wort in einer Stichprobe von englischen Wörtern etwa doppelt so häufig vor wie das zweithäufigste Wort, dreimal so häufig wie das dritthäufigste Wort usw. Dieser Trend setzt sich fort, wenn der Rang des Wortes abnimmt.

F: Wie viel Prozent aller Wörter macht das am häufigsten vorkommende Wort in einer Stichprobe von englischen Wörtern aus?

A: In einer Stichprobe von englischen Wörtern macht das am häufigsten vorkommende Wort ("the") fast 7% aller Wörter aus.

F: Welches Verhältnis besteht zwischen der Anzahl der Wörter, die benötigt werden, um die Hälfte der Stichprobe zu erklären, und der Häufigkeit dieser Wörter?

A: Nach dem Zipf'schen Gesetz sind nur etwa 135 Wörter erforderlich, um die Hälfte der Wörter in einer großen Stichprobe zu erfassen.

F: Für welche anderen Ranglisten gilt das Zipf'sche Gesetz?

A: Die gleiche Beziehung, die das Zipf'sche Gesetz für die Häufigkeit von Wörtern beschreibt, findet sich auch in anderen Rankings, die nichts mit Sprache zu tun haben, wie z.B. die Bevölkerungsranglisten von Städten in verschiedenen Ländern, Unternehmensgrößen und Einkommensranglisten.

F: Wem ist das Auftreten der Verteilung in der Rangliste der Städte nach Einwohnerzahl aufgefallen?

A: Das Auftreten der Verteilung in der Rangliste der Städte nach Einwohnerzahl wurde erstmals von Felix Auerbach im Jahr 1913 festgestellt.

Suche in der Enzyklopädie