r,表示被截断的字符只有1个,可以检索出clouDr,clouer等。 此外,在扩大中文检索范围时,也可采用截词技术。比如只知道作者的姓氏而忘了名字时,可在姓氏后面加“?”做姓氏截词,如输入“刘?”,表示检索所有“刘”姓作者的文献。 从以上例子可以看出,使用...
截词是指在适当的位置截掉搜索词,然后用截词字符进行处理,既可以节省输入字符数,又可以达到较高的召回率。特别是在西文检索系统中,使用分词符号处理自由词,对提高查全率有显著效果。 分词检索一般是指右分词,部分支持中间分词。截取词检索有助于提高检索的召回率。在分词检索技术中,常用的有两种方法:后分词和中分词...
截词(Truncation)检索就是利用检索词的词干或不完整的词形进行检索。 把检索词截断,取其中的一部分片段,再加上截词符号一起检索,计算机按照词的片段与数据库里的索引词对比匹配,凡包含有这些词的片段的文献均被检出。 1.任意截词:是指检索词串与被检索词实现部分一致的匹配。常用“*”来表示一串字符,截断形式...
右截词是截词检索的一种类型,右截词又称后截词、前方一致。允许检索词的词尾有若干变化,右截断主要用在:①词的单复数;②年代;③作者;④查同根词。定义 截词检索也称“模糊检索”,指在检索式中用专门符号(截词符号)来表示检索词的某一部分允许有一定的词形变化,即加前缀和后缀,检索词的不变部分加上...
1. 前截词:前截词是指在检索词的开头进行截断,以缩小检索范围。例如,在搜索引擎中输入“中”,可以检索到包含“中国”、“中华”、“中行”等关键词的网页。前截词主要用于查找特定关键词的变形或相关词汇,提高查全率。 2. 后截词:后截词是指在检索词的末尾进行截断,以缩小检索范围。例如,在搜索引擎中输入“...
pajamas→jams.clipping(截略)是一种构词方法,即对长词加以略写,从而构成新词,但同义保持不变。截略同常用于非正式语体,口语中尤为常见。混合法:将两个词的某一部分合并,或者将一个词加上另外一个词的一部分紧缩而成一个新词,前半部分表属性,后半部分表主体。
我们在课程中讲到词组检索时需要添加引号,如果截词检索加上引号,会发现检索结果为0,这是因为引号表示限定检索,括号里是什么样就检索什么单词,而事实上不存在"Degenerative Arthriti*"这样的单词,所以结果是0。 这并不是说我们词组检索需要添加引号是错误的,...
中间截词则着重于处理英美拼写差异和单复数拼写变化,通常仅允许有限截词。比如,对于“wom?n”和“comput*”,前者处理的是不同拼写,后者则允许词尾无限变化,如“computer”、“computing”等。这种检索方式类似于布尔逻辑中的“或”运算,但需要精确掌握截词位置,以确保查准率。过短的截词(通常建议...