前提:某个字段是中文,要用这个字段做升序,结果es默认的是unicode编码排序,与需求按拼音排序不符,故而引入了拼音分词器实现 1、下载拼音分词器插件 bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v7.17.3/elasticsearch-analysis-pinyin-7.17.3.zip 2、创建...
* 1、分析key,获取拼音词干 case : 南京东路==>[nan,jing,dong,lu],南京donglu==>[nan,jing,dong,lu] * 2、搜索查询,必须匹配所有拼音词,如南京东路,则nan,jing,dong,lu四个词干必须完全匹配 * 3、如果有中文前缀,则排序优先 * 权重*1*/QueryBuilder pingYinFullQueryBuilder=null;if(key.length()>1)...
Elasticsearch实战(二):Springboot实现Elasticsearch自动汉字、拼音补全,Springboot实现自动拼写纠错 文章目录 系列文章索引 一、安装ik拼音分词器插件 1、下载地址 2、下载安装 3、属性大全 二、自定义语料库 1、新增索引映射 2、批量新增文档 3、查询结果 三、产品搜索与汉字、拼音自动补全 1、概念 2、java实现汉字自...
{"index": {"analysis": {"analyzer": {"default": { //預設分詞器使用ik分詞器"tokenizer":"ik_max_word"},"pinyin_analyzer": { //自定義拼音分詞器"tokenizer":"my_pinyin"} },"tokenizer": {"my_pinyin": { //拼音分詞器配置"type":"pinyin","keep_first_letter":true,"keep_separate_first...
传统的中文排序方式是按照汉字的拼音排序,但这种方式并不符合大部分中文用户的习惯。为了解决这个问题,Elasticsearch 引入了一种新的排序方式,即汉字的偏旁部首排序。 二、汉字的偏旁部首排序 汉字的偏旁部首排序是基于汉字的结构特点进行排序的。在汉字中,每个字都由若干个偏旁和部首组成。偏旁是汉字的构成要素,而部首...
第一种,做拼音冗余。即在向ES同步数据时候,同步程序将汉字字段同时转换成拼音,在ES里专门用于汉字排序。如: #插入信息 POST /test/star/1 { "xm": "刘德华", "xm_pinyin": "liudehua" } POST /test/star/2 { "xm": "张惠妹", "xm_pinyin": "zhanghuimei" } # 查询排序 POST /test/star/_searc...
2.2 拼音补全OpenAPI 使用拼音访问【小米】 http://localhost:8888/v1/docs/csuggest 全拼访问 { "indexName": "product_completion_index", "suggestFileld": "searchkey", "suggestValue": "xiaomi", "suggestCount": 13 } 全拼访问(分隔) ...
资料准备 • solr7.0下载 • IK分词器下载 • 拼音分词器下载 solr文件目录(只讲一下7有些变化的目录) • web目录 : solr7/server/solr_webapp/webapp/ • home目录 : solr7/server/solr • bin目录 : solr7/bin 创建Core 运行solr #进入b...Elasticsearch...
elasticsearch之拼音搜索 拼音搜索在中文搜索环境中是经常使用的一种功能,用户只需要输入关键词的拼音全拼或者拼音首字母,搜索引擎就可以搜索出相关结果。在国内,中文输入法基本上都是基于汉语拼音的,这种在符合用户输入习惯的条件下缩短用户输入时间的功能是非常受欢迎的; 一、安装拼音搜索插件 下载对应版本的elasticsearch...