},"filter": {//自定义tokenizer filter"py": {//自定义过滤器的名称,可随意取"type":"pinyin",//过滤器类型,这里是pinyin"keep_full_pinyin":false,//修改可选参数,具体可参考拼音分词器GitHub官网"keep_joined_full_pinyin":true,"keep_original":true,"limit_first_letter_length":16,"remove_duplicated...
一、安装拼音分词器 拼音分词器的下载地址为:https://github.com/medcl/elasticsearch-analysis-pinyin/releases 由于我使用的 ElasticSearch 的版本是 8.8.2 ,所以我随便找了一个 8 版本中最高的版本(8.9.2)进行下载。 下载完成后进行解压,发现其实是拼音分词器的源代码,需要使用 IDEA 打开源代码,然后修改其 pom...
为了避免搜索到同音字,在创建索引库是时使用拼音分词器,在搜索时尽量不用。 completion suggester es提供了completion suggester查询来实现自动补全功能,这个查询的概念就是匹配用户输入内容开头的词条并返回,对于文档中字段的类型,要遵循:参与补全查询的字段必须是completion类型;并且字段值是多个词条形成的数组。举个栗子:...
1、completion suggester查询 2、使用DSL语句进行查询 3、RestClient实现自动补全 一、自动补全 当用户在搜索框输入字符时,提示出与该字符有关的搜索项,如图: 二、使用拼音分词 开源的拼音分词插件:Pinyin Analysis plugin。 ① 下载解压 ② 上传到plugin目录/var/lib/docker/volumes/es-plugins/_data 查看elasticsear...
一、自动补全 当用户在搜索框输入字符时,提示出与该字符有关的搜索项,如图: 自动补全.png 二、使用拼音分词 开源的拼音分词插件:Pinyin Analysis plugin。 ① 下载解压 ② 上传到plugin目录/var/lib/docker/volumes/es-plugins/_data 查看elasticsearch的plugins目录位置,命令如下: ...
一、安装ik拼音分词器插件 1、下载地址 2、下载安装 3、属性大全 二、自定义语料库 1、新增索引映射 2、批量新增文档 3、查询结果 三、产品搜索与汉字、拼音自动补全 1、概念 2、java实现汉字自动补全 3、java实现拼音自动补全 四、语言处理(拼写纠错) ...
2.1.pinyin拼音分词器的介绍和安装 2.2.自定义分词器,ik+拼音过滤 2.2.1 实现方法 2.2.2 索引分词器和搜索分词器问题 2.3.自动补全查询,conmpetion suggester 2.4.实现酒店搜索框自动补全 2.4.1.创建新索引库,使用自定义分词器 2.4.2.HotelDoc实体类添加suggestion字段 ...
启动Elasticsearch:启动Elasticsearch服务,插件将会被自动加载。 启动成功后,拼音插件就已经成功安装并可用了。 2.3.3 验证拼音插件 为了验证拼音插件是否成功安装,我们可以使用Elasticsearch的_analyze API进行测试。 通过发送如下的HTTP POST请求,我们可以对文本进行拼音分词测试: POST /_analyze { "analyzer": "pinyin"...
这个请求将使用pinyin_analyzer分析器对文本“我是中国人”进行分析,并返回拼音分词结果。 5. Elasticsearch拼音分词器的应用场景 拼音搜索:允许用户通过输入拼音来搜索相关的中文内容。 自动补全:在搜索框中提供基于拼音的自动补全功能,提高用户体验。 文本分析:对中文文本进行拼音转换,以便于后续的自然语言处理任务。 通...
1.Suggester自动补全 注意使用suggester的字段,的字段类型必须是completionSuggester的es语法介绍 匹配:能够通过用户的输入进行前缀匹配; 排序:根据建议词的优先级或者搜索热度进行排序; 纠错:能够对用户的输入进行拼写纠错(suggest建议优先prefix匹配,不宜过多提示,因此只需提供前缀匹配,中文拼音匹配即可) ...