CPLM-CSC采用基于单字级别预训练语言模型来进行错别字检测,并采用掩字语言模型来进行错别字纠正。为了提高纠正性能,CPLM-CSC采用音近、形近字判断等多种筛选纠正结果的方法,并针对一些典型且特殊的错误,例如“的地得”误用,采取了专门的数据增强方法。CPLM-CSC在SIGHAN 2015的评测数据集上进行了测试,取得了0.654的...
本文以HNC理论的概念基元符号体系与句类体系为基础,探索分析了汉语中单字动词组合处理的特点及其句类特征,总结形成了处理规则.从本文可以看到,HNC的概念基元符号体系与句类体系可以为汉语单字动词深入语义层面进行处理提供关键线索. 著录项 来源 《第八届全国人机语音通讯学术会议(NCMMSC8)》|2005年|379-382|共4页...
洛皮皮daily关注