1. 国家语委现代汉语通⽤平衡语料库 1.1 语料库全库 国家语委现代汉语通⽤平衡语料库全库约为1亿字符,其中1997年以前的语料约7000万字符,均为⼿⼯录⼊印刷版语料;1997之后的语料约为3000万字符,⼿⼯录⼊和取⾃电⼦⽂本各半。语料库的通⽤性和平衡性通过语料样本的⼴泛分布和⽐例...
语料语料库通用国家语委语次语用 家语委语代语语通用平衡语料语国语注语料语据及使用语明数1.家语委语代语语通用平衡语料语国1.1语料语全语家语委语代语语通用平衡语料语全语语语国1语字符,其中1997年以前的语料语7000万字符,均语手工语入印刷版语料;1997之后的语料语语3000万字符,手工语入和取自语子文本各半...
国家语委现代汉语通用平衡语料库 1.1 语料库全库 国家语委现代汉语通用平衡语料库全库约为 1 亿字符 其中 1997 年以前的语料约7000 万字符 均为手工录入印刷版语料 1997 之后的语料约为 3000 万字符 手工录入和取自电子文本各半。 语料库的通用性和平衡性通过语料样本的广泛分布和比例控制实现。语料库类别分布如...
国家语委现代汉语通用平衡语料库 1.1 语料库全库 国家语委现代汉语通用平衡语料库全库约为1亿字符,其中 1997年以前的语料约7000万字符,均为手工录入印刷版语料;1997之后的语料约为 3000万字符,手工录入和取自电子文本各半。 语料库的通用性和平衡性通过语料样本的广泛分布和比例控制实现。语料库类别分布如下所示: ...
1 国家语委现代汉语通用平衡语料库 该语料库是由国家语言文字工作委员会主持,面向语言文字信息处理、语言文字规范和标准的制定、语言文字的学术研究、语文教育以及语言文字的社会应用,总体规模达1 亿字,语料时间跨度为1919-2002年,收录了人文与社会科学、自然科学及综合
1. 国家语委现代汉语通⽤平衡语料库 1.1 语料库全库 国家语委现代汉语通⽤平衡语料库全库约为1亿字符,其中1997年以前的语料约7000万字符,均为⼿⼯录⼊印刷版语料;1997之后的语料约为3000万字符,⼿⼯录⼊和取⾃电⼦⽂本各半。语料库的通⽤性和平衡性通过语料样本的⼴泛分布和⽐例...
1.1 语料库全库 国家语委现代汉语通用平衡语料库全库约为1亿字符,其中1997年以前的语料约7000万字符,均为手工录入印刷版语料;1997之后的语料约为3000万字符,手工录入和取自电子文本各半。语料库的通用性和平衡性通过语料样本的广泛分布和比例控制实现。语料库类别分布如下所示:1.2 标注语料库 标注语料库为...
1. 国家语委现代汉语通⽤平衡语料库 1.1 语料库全库 国家语委现代汉语通⽤平衡语料库全库约为1亿字符,其中1997年以前的语料约7000万字符,均为⼿⼯录⼊印刷版语料;1997之后的语料约为3000万字符,⼿⼯录⼊和取⾃电⼦⽂本各半。语料库的通⽤性和平衡性通过语料样本的⼴泛分布和⽐例...