北京大学中国语言学研究中心CCL现代汉语语料库是一个非盈利性学术资源,主要用于语言学研究和自然语言处理领域。它由北京大学计算语言学研究所开发,2024版总规模达60亿字,覆盖现代汉语、古代汉语及双语语料。该语料库提供多样化的文本分析和检索功能,支持汉语拼音标...
CCL现代汉语语料库是由北京大学计算语言学研究所(也有说法为北京大学中文系语言学研究中心或北京大学计算语言学研究中心)开发并维护的一个大型现代汉语语料库。以下是对CCL现代汉语语料库的详细介绍: 一、规模与内容 CCL现代汉语语料库规模庞大,包含了数十亿字的现代汉语文本数据。这些文本数据涵盖了新闻、文学、学术论文...
。词频数据可通过专业软件进行统计 。数据处理过程需保证准确性和科学性 。对词频异常的词汇要深入分析原因 。可能是新用法,也可能是错误使用 。多维度的词频分析能揭示语言深层规律 。包括语义、语用等方面的潜在联系 。国家语委现代汉语语料库词频分析意义重大 。 推动汉语研究、教学及应用不断发展 。
国家语言资源动态流通语料库与北大CCL现代汉语语料库是学术界常用的两大语料库资源。面对提问,首先需明确,国家语言资源动态流通语料库和CCL现代汉语语料库在学术界的地位与特点。国家语言资源动态流通语料库,作为国家层面的专业语料库,承载着丰富多样的语言资源,为语言学研究、教育以及相关领域提供了坚实的...
现代汉语“他”(CCL语料库)同时教育学又是在不断地综合其他科学知识的过程中发展起来的为了深刻理解教育理论就必须具有其学知识的过程中发展起来的为了深刻理解教育理论就必须具有其他的有关学科的知识如哲学社会学伦理学生理学心理学教育 现代汉语“他”(CCL语料库) 现代汉语“他”(CCL语料库) 13、14世纪、、、轻...
1.北京大学CCL现代汉语语料库 http://ccl.pku.edu.cn:8080/ccl_corpus/ 2.北京语言大学BCC语料库 http://bcc.blcu.edu.cn/ 3.国家语委现代汉语语料库 http://corpus.zhonghuayuwen.org/cncindex.aspx 4.北京语言大…
CCL 语料库-现代汉语 总字频数: 307, 317, 060 总字种数: 9711 字频表: 的: 11523375 一: 4140344 是: 3291508 了: 3059837 在: 2933070 人: 2827726 不: 2733842 国: 2645758 有: 2507415 中: 2182025 他: 2029395 这: 1968713 我: 1940875 和: 1872750 大: 1832977 个: 1701835 上: 1615128 为...
CCL 语料库-现代汉语语料分布情况 2009.7.20 分类 字节数 分类 字节数 当代\口语 259506 当代\报刊\人民日报 187855650 当代\史传 1004728 当代\应用文 127650059 当代\应用文 127650059 当代\翻译作品 当代\报刊\人民日报 187855650 当代\文学 当代\报刊\作家文摘 当代\翻译作品\文学 当代\报刊\市场报 当代\报刊\...
CCL语料库-现代汉语总字频数:307317060总字种数:9711字频表:的:1153375一:4140344是:391508了:3059837在:933070人:8776不:73384国:645758有:507415中:1805他:09395这:1968713我:1940875和:187750大:183977个:1701835上:161518为:160794年:15938地:146411来:1456483会:144
CCL语料库-现代汉语语料分布情况 2009.7.20 分类字节数分类字节数 当代\口语259506当代\报刊\人民日报187855650 当代\史传1004728当代\应用文127650059 当代\应用文127650059当代\翻译作品86996845 当代\报刊\人民日报187855650当代\文学63055842 当代\报刊\作家文摘28162469当代\翻译作品\文学58046004 ...