在ES内置的分词过滤器中还有个分词过滤器叫作synonym_graph,它是一种支持查询时用户自定义同义词的分词过滤器。 PUT /hotel { "settings": { "analysis": { "filter": { //定义分词过滤器 "ik_synonyms_graph_filter": { "type": "synonym_graph", "synonyms": [ //在分词过滤器中定义近义词 "北京,...
然后在创建旅馆索引时,在settings中指定同义词文件及其路径,DSL如下: PUT /hotel { "settings": { "analysis": { "ik_synonyms_graph_filter":{ "type":"synonym_graph", "synonyms_path":"mydict/synonyms.dict" }, "analyzer": { "ik_analyzer_synonyms_graph":{ "tokenizer":"ik_max_word",//指定...
上面需要注意的是我安装了ik分词器,然后自定义的分词器中的filter添加了Synonym graph token filter.synonyms_path的位置是以ES的config开始算的.所以我们需要创建{es}/config/analysis/synonym.txt文件来存放我们自定义的近义词表.近义词表中的格式如下:
"filter": [ "synonym" ] } }, "filter": { "synonym": { "type": "synonym_graph", "synonyms_path": "analysis/synonym.txt", "updateable": true } } } } }, "mappings": { "properties": { "text": { "type": "text", "analyzer": "ik_max_word", "search_analyzer": "my_sy...
"type": "synonym_graph", "synonyms_path": "analysis/synonym.txt" } } } } }, "mappings": { "properties": { "key1": { "type": "text", "fields": { "keyword": { "type": "keyword", "ignore_above": 256 } }, "analyzer": "my_ik" }, "key2": { "type": "text", "fie...
该查询支持使用 synonym_graph 标记过滤器进行多术语同义词扩展。 使用此过滤器时,解析器会为每个多词同义词创建一个短语查询。 例如,以下同义词:match”ny, new york” 会产生: 1 (ny OR ("new york")) 也可以用连词来匹配多词同义词: 1234567891011 GET /_search{ "query": { "match" : { "message...
"wordNetSynonymGraphPath": "/tmp/wordnet-synonym.graph", "wordNetSynonymDictGraphPath": "/tmp/wordnet-synonym.dict.graph", "isBuildWordNetDictWithGraph": true, "isBuildWordNetSynonymDictWithGraph": true, "onUpdateWordNetDictWithGraphPath": false, "onUpdateWordNetSynonymDictWithGraphPath": ...
阿里云Elasticsearch Serverless(简称ES Serverless)应用中默认安装elasticsearch-analysis-dynamic-synonym插件,该插件支持动态加载同义词文件,本文介绍如何在ES Serverless应用中实现同义词动态更新。
如果返回结果中包含analysis-dynamic-synonym插件,且版本与Elasticsearch实例版本一致,说明插件安装成功。 步骤四:配置实例私网打通(可选) 如果您的词典文件存储在与阿里云Elasticsearch实例处于同一地域下的OSS中,可以忽略此步骤。 阿里云Elasticsearch控制台。 配置Elasticsearch实例私网连接,获取终端节点域名作为访问外部服务的...
- 同义词扩展:Elasticsearch支持使用同义词过滤器,如`synonym_graph`过滤器,它可以保持词与词之间的关系,避免同义词导致的语义丢失。用户需要提供同义词词典文件,并在分析器配置中引用。 本资源包可能包含的组件和使用说明: 1. 插件:Elasticsearch的插件可能包含热词、停用词和同义词处理的功能,方便用户安装和使用。 2...