藏语分词与词性标注研究的综述报告藏语属于汉藏语系中的藏缅语族,是中国的少数民族语言之一。藏语是我国五大语系之一,也被广泛地使用在印度、尼泊尔、不丹等国家和地区。藏语的语法体系属于灵活型语言,因此在分词和词性标注方面,藏语有着独特的特点,这也是学习和研究藏语的重要内容之一。一、藏语分词的特点藏语的分词与中...
词性藏语分词标注tibetan标签集 上海师范大学博士学位论文藏语分词与词性标注研究论文题目:藏语分词与词性标注研究学科专业:中国少数民族语言文学学位申请人:康才唆指导教师:**潘悟云摘要藏语信息处理技术经过二十多年的发展,无论是在藏文信息处理研究及其相关标准制定方面,还是在藏语信息处理应用开发方面,都取得了不少成绩。
本项目首先收集了多部藏语字、词典的所有词条及藏语标点符号,形成了约10万词条的大型藏语分词词库;根据藏字不同长度的特点,建立了藏语特有的多级索引分词词典机制,分析设计藏语整词二分法进行藏语分词。3) Tibetan vocabulary 藏语词汇 1. The borrowing and coinage of Tibetan vocabulary enjoyed a long history main...
藏语自动分词技术是藏语自然语言处理的基础。文章通过分析藏语真实文本中的数词分类、数词词形以及数词结构等,提出了一种基于规则的识别方法。文章中的藏语数词识别思想为:在自动分词过程中,通过判断待切分的词(w)i和已切分的词(wi-1)来重新组合。经对小学一至六年级的数学藏文版教材及1500个含各类数词的句子语料进行...
基于条件随机场的藏语自动分词方法研究与实现
现代藏语组块分词的方法与过程The Method and Process of the Definition to Grammatical Chunks in Modern Tibetan 作者: 江荻 作者机构: 中国社会科学院民族学与人类学研究所,北京100081 出版物刊名: 民族语文 页码: 30-39页 主题词: 藏语;句法;语法标记;组块结构现象 摘要:本文重点描述了现代藏语句法的形式标记...
本书是“中国语言生活绿皮书”的A系列,包括“藏文拉丁字母转写方案(草案)”及“信息处理用现代藏语分词规范(草案)”“信息处理用现代藏语词类标记集规范(草案)”三部分,“藏文拉丁字母转写方案(草案)”规定了藏文转写成拉丁字母符号以及转写的规则;“藏文拉丁字母转写方案(草案)”规定了现代藏语的分词原则,以满足信息...
“信息处理用现代藏语分词规范(草案)”规定了现代藏语的分词原则,以满足信息处理的需要; “信息处理用现代藏语词类标记集规范(草案)”规定了信息处理中现代藏语词类及其他切分单位的标记代码。 我要写书评 藏文拉丁字母转写方案(草案) 信息处理用现代藏语分词规范(草案) 信息处理用现代藏语词类标记集规范(草案)的书评 ...
当当商务印书馆官方旗舰店在线销售正版《藏文拉丁字母转写方案(草案)信息处理用现代藏语分词规范(草案)信息处理用现代藏语词类标记集规范(草案》。最新《藏文拉丁字母转写方案(草案)信息处理用现代藏语分词规范(草案)信息处理用现代藏语词类标记集规范(草案》简介
“藏文拉丁字母转写方案(草案)”规定了藏文转写成拉丁字母符号以及转写的规则;“信息处理用现代藏语分词规范(草案)”规定了现代藏语的分词原则,以满足信息处理的需要;“信息处理用现代藏语词类标记集规范(草案)”规定了信息处理中现代藏语词类及其他切分单位的标记代码。