Anonim

1935 bemerkte der amerikanische Linguist George Kingsley Zipf ein merkwürdiges Muster in der Wortfrequenz. In jedem Text kommt das häufigste Wort doppelt so häufig vor wie das zweithäufigste, und es gibt noch mehr: Die dritthäufigste Worthäufigkeit tritt ein Drittel der Zeit in Bezug auf das erste, das vierte und vierte usw. auf.

Das Gesetz von Zipf gilt nicht nur für die englische Sprache, sondern auch für Italienisch und alle anderen Sprachen, auch für diejenigen, die so alt sind, dass sie noch nicht entziffert wurden. Egal wie lange das Schema bestätigt wurde, niemand hat es jemals erklären können.

Bücher, Sprachen, Linguistik, Statistik, Worthäufigkeit, zipf, zipf Gesetz Die häufigsten Wörter in Pinocchio: Der Trend folgt fast genau der Zipfiana-Linie. Weitere Informationen: Parole e frequenze von Alessandro Lenci (PDF). | Alessandro Lenci, Universität Pisa

Nun bietet Sander Lestrade, ein Linguist an der Radboud University (Niederlande), eine Erklärung an: Zipfs Gesetz lässt sich durch die Wechselwirkung in einem Text zwischen der Struktur von Sätzen (Syntax) und der Bedeutung von Wörtern (Semantik) erklären.

Mithilfe von Computersimulationen konnte Lestrade zeigen, dass weder Syntax noch Semantik allein eine Zipfian-Distribution auslösen können, ihre Kombination jedoch erfolgreich ist.

"Da Artikel vor fast allen Namen verwendet werden, erscheinen einzelne Artikel häufiger als Namen." Es reicht aber nicht aus: "Auf dem Gebiet der Namen gibt es auch große Unterschiede: Das Wort" Ding "ist beispielsweise viel häufiger als" U-Boot "und kann häufiger verwendet werden. Aber um effektiv häufig zu sein, darf ein Wort nicht zu allgemein sein ».

Italienischer Herkunft. Zipf ließ sich von seinem Gesetz vom Pareto-Prinzip inspirieren. 1896 erkannte der italienische Ökonom Vilfredo Pareto, dass 80% des Landes 20% der Bevölkerung gehörten. Aber es war noch einmal nicht vorbei: Als er die Erbsenpflanzen in seinem Garten beobachtete, bemerkte er, dass 20% der Schoten 80% der Erbsen enthielten.

Aus unvorhersehbaren Gründen sind diese Anteile überall auf der Welt anzutreffen, natürlich und nicht: 1989 besaßen 20% der Bevölkerung 82, 7% des Wohlstands; In den Vereinigten Staaten verwenden 20% der Patienten 80% der medizinischen Ressourcen und so weiter.

Sogar das Gesetz von Zipf spiegelt sich in der Statistik der Ereignisse wider, die nicht mit Worten verbunden sind. Von der Stärke der Erdbeben bis zu den Eröffnungszügen im Schach, vom Durchmesser der Krater auf dem Mond bis zum Verkehr von Internetseiten: In all diesen (und vielen anderen) Fällen ist die Frequenzskala immer zipfiana.