分析结果表明,如果除去少数只出现了一两次的词语,有55%的文本完全地符合齐普夫定律,而如果考虑所有的词语,仍然有40%的文本完全符合齐夫定律。该研究的负责人科拉尔(Á.Corral)称,如果进一步忽略只出现3至5次的词语,符合齐普夫定律的文本数还会更多。2016年,江南大学的研究者以诺贝尔文学奖得主莫言的《红高粱》...
齐夫定律公式齐夫定律公式为:F(r)=Cr^α,其中α≈1,C≈0.1。齐夫定律可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。©2022 Baidu |由 百度智能云 提供计算服务 | 使用百度前必读 | 文库协议 | 网站地图 | 百度营销 ...
齐夫定律(英语:Zipf's law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律。 它可以表述为: 在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。 所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍, 而出现...
齐夫定律(英语:Zipf's law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律。 它可以表述为: 在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。 所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍, ...
齐夫定律(Zipf's law)是由哈佛大学的语言学家乔治·金斯利·齐夫于1949年发表的从实验中总结的定律。它可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。所以,出现频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2...
齐夫定律的基本概念 齐夫定律由美国哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年提出,它可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。具体来说,如果一个单词是语料库中出现频率最高的单词,那么它的出现频率大约是出现频率第二位的单词的两倍,而第二位...
1. 从齐夫定律到最省力原则 齐夫定律是哈佛大学语言学家乔治·齐夫(George Zipf)1949年发现的一个实验定律,即在自然语言里,一个单词出现的频率与它在频率表里的排序成反比。 例如,在英语的 Brown 语料库中,「the」、「of」、「and」是出现频率最高,排序 1、2、3 的单词,分别占整个语料库100万个单词数的...
1. 从齐夫定律到最省力原则 齐夫定律是哈佛大学语言学家乔治·齐夫(George Zipf)1949年发现的一个实验定律,即在自然语言里,一个单词出现的频率与它在频率表里的排序成反比。 例如,在英语的 Brown 语料库中,「the」、「of」、「and」是出现频率最高,排序 1、2、3 的单词,分别占整个语料库100万个单词数的 ...
中国人!中国人!与齐夫一起创造历史! George Kingsley Zipf (1902-1950) 齐夫定律 齐夫定律是计算语言学、计量语言学中的金科玉律,也是经济学、社会学等诸多领域广泛使用的定律。我们知道齐夫定律是说,词语出现的频次和其排名成反关系。出现频率高的词型比较少,而出现次数低的词,占据词型的大多数,如图1所示。