以下是nGramtokenizer 的设置: token_chars所接受以下的形式: 例子: Whitespace Tokenizer whitespace类型的分词将文本通过空格进行分词。 Pattern Tokenizer 一个pattern类型的分词可以利用正则表达式进行分词。 IMPORTANT: 正则表达式应该和 token separators相匹配, 而不是 tokens 它们本身. 使用elasticsearch 不同语言的API...
oxe, xes](这里开始有点懵,不是说token中可包含字母和数字吗,然后反应过来token_chars含义是指定了token中可包含的内容,其他的都不可以,因为指定了窗口长度为3,如果想包含2这个数字,因为后面跟了一个空格,所以2是肯定无法包含在哪个token中的)。
"token_chars":[ "letter", "digit" ] }, "my_tokenizer2":{ "filter":[ "lowercase" ], "type":"ngram", "min_gram":2, "max_gram":3, "token_chars":[ "letter", "digit" ] } } } } 增加Mappings PUT tangxue_test_index_20201222/_mapping/medicalrecord?update_all_types { "properti...
PUT /index/_settings { "number_of_shards":"8", "max_inner_result_window":"130000", "max_result_window":"130000", "analysis":{ "analyzer":{ "ngram_analyzer":{ "tokenizer":"ngram_tokenizer" } }, "tokenizer":{ "ngram_tokenizer":{ "token_chars":[ "letter", "digit", "punctuatio...
},"tokenizer":{"my_tokenizer":{"token_chars":["letter","digit","whitespace","punctuation","symbol"],"type":"ngram"} } } } } } 3、查询mapping GET /saas-mp-promotion-search_activity/_mapping 4、创建mapping type注意大小写 PUT saas-mp-promotion-goods-sync-test/_doc/_mapping?include...
"tokenizer": { "ngram_tokenizer": { "token_chars": [ "letter", "digit" ], "min_gram": "1", "type": "ngram", "max_gram": "2" } } 分词效果: 分词结果较多,图片只截取了部分。使用 NGram 分词器后,针对输入如“7”、“上”、“广”等内容,搜索系统能够有效地返回相关结果。这是因为...
"token_chars" : [ //指定生成的token应该包含哪些字符.对没有包含进的字符进行分割,默认为[],即保留所有字符。 代码语言:txt 复制 "letter", // 代码语言:txt 复制 "digit" // 代码语言:txt 复制 ], 代码语言:txt 复制 "min_gram" : "1", // 指定最小步长,按需配置。
"token_chars": [ "letter", "digit", "punctuation" ], "type": "ngram", "max_gram": "1" } } }, "number_of_replicas": "1" } }, "mappings": { "user_info": { "dynamic": "false", "properties": { "es_updatetime": { ...
"token_chars": ["letter", "digit", "punctuation", "symbol"], "min_gram": "1", "type": "nGram", "max_gram": "1" } } } } }, "mappings": { "doc": { "properties": { "id": { "type": "long" }, "pd_name": { ...
角色索引创建脚本 PUT roleentity {"settings": {"number_of_shards":1, "number_of_replicas":3} } GET roleentity PUT roleentity/_alias/baserole GET roleentity/_mapping PUT roleentity/_mapping/roleentity {"properties": {"id": {"type": "text", ...