合用于汉语信息处理,也可供现代汉语教学与研究参照。 2术语和定义 下列术语和定义合用于本原则。 2.1汉语信息处理Chinese Information Processing, CIP 用计算机对汉语形、音、义等信息进行输入、排序、存储、输出、记录、提取等。 2.2切分单位Segment Unit 汉语信息处理使用旳、具有确定语法功能旳基本单位。它包括本原则...
信息处理用现代汉语词类及词性标记集规范 1 信息处理用现代汉语词类及词性标记集规范 (征求意见稿)教育部语言 文字应用研究所计算语言学 室“语料库加工”课题组 2002- 04- 081. 名词( n) ,表示人和事物的名称或时间、位置,在句中主要充当 主语和宾语。如:手 山 云 学生 暑假 字典 长城乏专木陶怎侩奉柬治...
在信息处理用现代汉语词类体系中,各词类的确立要根据词的主要语法功能。•覆盖性原则。词类标记集中的大类应能覆盖现代汉语的全部词。有关说明 •为满足计算机处理真实文本的需要,《信息处理用现代汉语词类标记集规范》中的符号,不仅要覆盖语言学意义上的词,还要覆盖比词小的单位,如前接成分(前缀)、后接成分...
标记规范标准修订《信息处理用现代汉语词类标记规范》的研制顺应了语言资源建设和信息处理研究的需要,颁布实施后为语料库和信息处理系统词类标记的规范化起到了基础性和参照性作用,但随着理论研究和应用实践的发展,其局限也日益凸显.本文在总结规范修订前期工作的基础上,对修订思路和修订策略进行阐述,提出了拟通过规范修订...
信息处理用现代汉语词类标记规范-中华人民共和国教育部.pdf 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 信息处理用现代汉语词类标记规范-中华人民共和国教育部.pdf信息处理用现代汉语词类标记规范-中华人民共和国教育部.pdf信息处理用现代汉语词类标记规范-中华人民共和国教育部.pdf 下载文档 收藏 ...
信息处理用现代汉语词类及词性标记集规范 (征求意见稿) 教育部语言文字应用研究所计算语言学室 “语料库加工”课题组 2002-04-08 1.名词(n),表示人与事物的名称或时间、位置,在句中主要充当主语与宾语。如: 手山云 学生 暑假字典长城 人类 车辆 气氛 意识 老者 运动员 今年 近代 清早 星期一 里头 下面 周围...
《GB/T 20532-2006 信息处理用现代汉语词类标记规范》是一项由中国国家标准局发布的技术标准,旨在为自然语言处理、信息检索、机器翻译等领域的计算机信息系统提供一套统一的现代汉语词汇分类及标记方法。该标准详细定义了现代汉语中各类词的类别和相应的标记符号,以便于计算机程序能够准确理解和处理中文文本数据。以下是该...
二.信息處理用現代漢語詞類標記集規範的研製(二)術語及解釋 1.2.3.4.5.詞:為滿足計算機處理真實本文的需要,不儘包括語言學意義上的詞,也包括一些比詞小的成分,如前接成分(前縋),後接成分(後綴),語素字,非語素字,;比詞大的成分,如成語,慣用語,簡略稱語;標點符號,非漢字符號詞類:對上述...
一引言 用于现代汉语信息处理系统中的汉语词类标记集有很多种设计方案.经过多年的研究,人们对现代汉语词类问题有了更多的共识,但在分类依据上,在词类多少上,在术语使用上仍有分歧;而中文信息处理学界所使用的词类标记集也不统一. 关键词: 信息处理 现代汉语 词类标记集 分类依据 术语使用 数据转换 《信息处理用现代...