Ngrams 和 edge ngrams 是在 Elasticsearch 中标记文本的两种更独特的方式。 Ngrams 是一种将一个标记分成一个单词的每个部分的多个子字符的方法。 ngram 和 edge ngram 过滤器都允许你指定 min_gram 以及 max_gram 设置。我在文章 “Elasticsearch: Ngrams, edge ngrams, and shingles” 有比较详细的描述。
solr的中文拼音分词过滤器,支持全拼,简拼和简拼和全拼同时输出,同时提供了一个基于NGram算法的类似EdgeNGramTokenFilter的过滤器,但实现了双向过滤。 - liangbaolin/pinyinAnalyzer