齐普夫定律(Zipf's Law)是文献计量学基本定律之一,1948年美国哈佛大学语言学教授G.K.齐普夫(George K.Zipf)对英语文献中单词出现的频次进行大量统计以检验前人的定量化公式而提出的。该定律指出文章中单词的频次(f)与其排列的序号(r)之间存在着下述定量的关系,齐普夫认为:“如果有一个包含n个词的文章,将这些词按...
反过来,80%低频率的元素,或者说长尾的元素,只构成20%的总量。这个规律,其实是齐普夫定律(Zipf’s Law)的一个特例。 齐普夫(George Kingsley Zipf)是美国20世纪初的语言学家,他经过对各种语言中词频的统计发现,一个词的排位,和它词频的乘积,近乎是一个常数。比如在汉语中,“的”是最常见的字,排位第一,它的字...
内容提示: Zipf’s Law: Balancing SignalUsage Costand Communication EfficiencyChristoph SalgeNihat AyDaniel PolaniMikhail ProkopenkoSFI WORKING PAPER: 1013-10-033SFI Working Papers contain accounts of scienti5ic work of the author(s) and do not necessarily representthe views of the Santa Fe ...
尽管zipf's law是在语言学中被发现的,但是现在已经深入到了很多其它领域当中。比如,在生物学中,蛋白质序列中就可能存在着zipf's law。[3]中给出了一些zipf's law在互联网中的存在。 Quelle:http://blog.csdn.net/historyasamirror/archive/2008/10/22/3125223.aspx...
Zipf's law 齐普夫定律 这是自然语言处理领域的一个有趣的定律,其实称为规律更合适,因为这是一个经验性的结果,是通过统计数据得出来的近似的规律。 它的定义有些绕口,就是说,在一个自然语言的语料库中,一个词的出现频数和这个词在这个语料中的排名(这个排名是基于出现次数的)成反比。