齐普夫定律是美国学者G.K.齐普夫于20世纪40年代提出的词频分布定律。它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。若用f表示频次,r表示...
<什么是“齐夫定律”?> ↓↓↓ 乔治·齐夫在整理自然语言的数据库时,发现某一单词出现的频率与其在频率表里名次的常数次幂成反比,也就是说极少数的单词会被经常使用,而绝大多数单词很少被提及,这种20/80法则在很多领域都被逐步发现,这种幂律分布被称为“齐夫定律”。 该实验定律可以在很多非语言学排名中被观察...
但据研究表明,伏尼契书稿的语言似乎是一种自然语言,符合语言学家乔治-金斯利-齐夫(George Kingsley Zipf ,1902-1950)在20世纪三四十年代提出的自然语言等应遵循的齐夫定律(Zipf‘s Law,IPA,das Zipfsche Gesetz),这一预言定律经常使用在语言学Linguistik,语料库语言学Korpuslinguistik和量化语言学quantitative Linguistik中...
它揭示了在多种领域中,如语言学、城市经济学、公司规模等,都存在一种普遍的规律。齐夫定律不仅限于语言学领域。在非语言学的排名中,如不同国家城市数量、公司规模、收入排名等,都能观察到类似的现象。例如,在城市经济学中,齐夫定律指出,人口规模最大的城市通常是第二大城市的两倍,第三大城市的...
zipfian 参数是什么 Zipfian distribution 齐夫定律 zipf law:在给定的语料中,对于任意一个term,其频度(freq)的排名(rank)和freq的乘积大致是一个常数。 Zipfian distribution 一个离散幂律概率分布,也就是常常提到的长尾模型.在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。
<什么是“齐夫定律”?> ↓↓↓ 乔治·齐夫在整理自然语言的数据库时,发现某一单词出现的频率与其在频率表里名次的常数次幂成反比,也就是说极少数的单词会被经常使用,而绝大多数单词很少被提及,这种20/80法则在很多领域都被逐步发现,这种幂律分布被称为“齐夫定律”。
齐夫定律(英语:Zipf's law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律。它可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二...
齐夫定律是一个实验定律,而非理论定律。齐夫分布可以在很多现象中被观察到。齐夫分布的在现实中的起因是一个争论的焦点。齐夫定律很容易用点阵图观察,坐标为log(排名)和log(频率)。比如,“the”用上述表述可以描述为x = log(1), y = log(69971)的点。如果所有的点接近一条直线,那么它就遵循齐夫定律。...