Zipfscheの法律 – ウィキペディア

before-content-x4

Zipfsche Law (1930年代にこの法律を設定したジョージ・キングスリー・ジップフによると)は、ランキングに持ち込まれた特定のサイズのランクに導かれるモデルです。法律は、言語学(言語学)、特にコーパス言語学と定量的言語学で頻繁に使用されていることを発見しています。たとえば、単語の頻度をテキスト内のテキストに関連付けようとします。 Zipfscheの法律は、定量的言語学のこのアプローチの始まりを示しました。
これは、ZIPFのパレート分布または分布によって数学的に説明される効力法則に基づいています。

after-content-x4

Zipfschen法の簡素化された声明は次のとおりです。
群衆の要素 – たとえば、テキストの言葉が頻度に応じて順序付けられている場合、確率は

p {displaystyle p}

それらの発生のうち、正方形に比例して逆

n {displaystyle n}

周波数リスト(ここでは「ランク」とまもなく呼ばれます):

標準化係数

n {displaystyle n}

要素は調和のとれたシリーズを通してです

after-content-x4

指定され、有限量でのみ指定できます。続きます:

Zipfscheの法律は、言語学に起源があります。特定の単語は他の単語よりもはるかに頻繁に発生し、ハイパーベルの分布が発生すると言います

1n{displaystyle {tfrac {1} {n}}}

似ている。たとえば、ほとんどの言語で長くなります。注文パラメーター ローストn 累積サイズとして説明できます:ランク

n {displaystyle n}

同様に、同じまたは大きいすべての要素の数と同義です

n {displaystyle n}

。ランクの場合 初め 正確に1つの要素、つまり最大の要素があります。ランクの場合 2 2つ、つまり、最初と2番目の要素はありますか? 3 3つなど。

ZIPFは、ランクへの単純な相互接続を受け入れます。

ロースト )) ロースト a {displaystyle y({text {roast}})sim {text {roast}}}^{ – a}}}}

。元の形式では、Zipfscheの法律にはパラメーターがありません。

a = 初め {displaystyle a = 1}

Zipfsche分布は、縦座標とアブシッサの交換とのパレート分布に対応しています。

どちらも、効力法に従う累積分布関数です。指数

そうです {displaystyle e}

それに応じて、分布密度関数は次のとおりです。

そして、単純なケースのために

a = 初め {displaystyle a = 1}

効果に基づく任意のZIPF分布

ドイツ語のテキストのzipf文字

テキスト内の単語周波数の分布(左翼グラフィック)は、ほぼ単純なzipft分布に対応しています。

Zipfsche Lawは指数を提供します

a {displaystyle a}

累積分布関数の:

a = 初め {displaystyle a = 1}

ただし、単語周波数の適合値は

a = 0 83 {displaystyle a = 0 {、} 83}

、指数と同義

a ポンド = 初め 20 {displaystyle a_ {text {pareto}} = 1 {、} 20}

パレート部門と指数

そうです {displaystyle e}

の効力分布密度関数

そうです = 2 20 {displaystyle e = 2 {、} 20}

文字周波数の分布は、ペストの分布にも似ています。 20〜30文字に基づく統計では、コースを効力関数に適応させるには十分ではありません。

ZIPF分布と都市のサイズ分布の測定

記事のパレート分布の別の例は、都市のサイズ分布を扱っています。ここでも できる 個々の国(ドイツなど)では、効力法に従うように見えるが、驚くべき逸脱があると思われるつながりがあります。右側のグラフィックは、ジップパイピングと測定値とは対照的です。二重ロガリズム分布の線形コースは、効力法の受け入れをサポートしています。 ZIPFの仮定とは異なり、指数には値1ではなく、値0.77があります。

そうです = 2 3 {displaystyle e = 2 {、} 3}

。この理論は、人口とサイズが互いに独立して発達し、依然としてより高いレベルの法則を発達させ、予想される位置サイズの決定にも使用されます。 [初め]

ZIPF分布の重要性は、さまざまな領域からの分布の迅速な定性的記述にありますが、パレート分布は分布の指数を改良します。

たとえば、わずか7つの都市の人口を指定する場合の適合のデータベースは小さすぎます。 Zipfsche Lawは近似を提供します。

ロースト n 居住者 1/rang p n )) p n )・人々 パーセントの偏差
初め ベルリン 3522896 初め 0.39 3531136.31 -0,23
2 ハンブルク 1626220 0.5 0.19 1765568,15 -8,57
3 ミュンヘン 1206683 0.33 0.13 1177045.44 2.46
4 ケルン 946280 0.25 0.1 882784,08 6.71
5 フランクフルト 635150 0.2 0.08 706227,26 -11.19
6 ドルトムント 624445 0.17 0.06 588522.72 0.93
7 食べる 594058 0.14 0.06 504448,04 19.22

キーワードのPutence Actの中で、Skalen Actまたは自己組織化は、効力分布の発生の理由で議論されています。

  • ヘルムート・ビルカン: 「Zipfsche Law」、弱い祈り、ゲルマンの音の変化 (= オーストリア科学アカデミー。哲学的歴史クラス。セッションレポート。 348)。オーストリア科学アカデミーの出版社、ウィーン1979、ISBN 3-7001-0285-2。
  • デビッド・クリスタル: ケンブリッジ言語百科事典。 Campus-Verlag、Frankfurt Am Main U。 a。 1993、ISBN 3-593-34824-1。
  • Xavier Gabaix: ZIPFの都市の法則:説明。 の: 経済学の四半期ジャーナル。 bd。114、no。 3、1999、S。739–767、2: 10.1162/00335399556133
  • Henri Guiter、Michaail V. Arapov(hrsg。): ZIPFの法律に関する研究 (= 定量的言語学。 Vol。16)。 Study Publisher Brockmeyer、Bochum 1982、ISBN 3-88339-244-8。
  • マッテオ・マルシリ、Yi-Cheng Zhang: ZIPFの法律につながる相互作用する個人。 の: 物理的なレビューレター。 bd。80、no。 12、1998、S。2741–2744、2: 10.1103/PhysRevlett.80.2741
  • ジョージ・キングスレーZIPF: 言語の精神生物学。ダイナミック言語学の紹介。 Mifflin、Boston MA 1935、(The M.I.T. Press、Cambridge MA 1968)。
  • ジョージ・キングスレーZIPF: 人間の行動と最小の努力の原則。人間の生態学の紹介。 Addison-Wesley、ケンブリッジMA 1949。
  1. クリスチャン・シュリペス、マーク・トレデ、12。2013年9月: ギブラット、ZIPF、フィッシャー、ティペット:都市の規模と成長分布が再考されました (PDF; 494 kb; 29ページ)、または インターネットアーカイブで 記念 2016年6月10日から インターネットアーカイブ )、2018年7月29日にアクセス。

after-content-x4