全文检索的思路类似于数据库的索引,它将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。这部分从非结构化数据中提取出的,然后重新组织的信息,我们称之索引。 比如字典,字典的拼音表和部首检字表就相当于字典的索引,对每一个字的解...
Lucene 是⼀个⾼效的,基于Java 的全⽂检索库。 所以在了解Lucene之前要费⼀番⼯夫了解⼀下全⽂检索。 那么什么叫做全⽂检索呢?这要从我们⽣活中的数据说起。 我们⽣活中的数据总体分为两种:结构化数据 和⾮结构化数据 。 结构化数据: 指具有固定格式或有限长度的数据,如数据库,元数据等。