Lucene 搜索方法（模糊搜索）

baobeituping

浏览: 1042045 次
性别:
来自: 长沙

最近访客更多访客>>

lindow

huazai740

Java技术干货

ccsxin201

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Lucene学习

lucene

LUCENE提供了一种模糊搜索的机制。

代码：

public static void main(String[] args) {
  try {
   IndexSearcher search = new IndexSearcher("d://demo");

   Term term1 = new Term("bookname","work");
   FuzzyQuery query = new FuzzyQuery(term1,0.1f,1);
   Hits hits = search.search(query);
   for(int i=0;i<hits.length();i++)
   {
    System.out.println(hits.doc(i));
   }
  } catch (Exception e) {
   e.printStackTrace();
  }

}

结果;

Document<stored/uncompressed,indexed,tokenized<bookname:work>>
Document<stored/uncompressed,indexed,tokenized<bookname:word>>
Document<stored/uncompressed,indexed,tokenized<bookname:world>>

注释：首先构建了一个TERM，并将其作为FuzzyQuery的构造函数，对于FuzzyQuery有两个构造函数，

public FuzzyQuery(Term term,float minimumSimilarity) throws IllegalArgumentException

public FuzzyQuery(Term term,float minimumSimilarity,int prefixLength) throws IllegalArgumentException

minimumSimilarity表示是最小相似度，可以通过指定一个相似度来决定模糊匹配的严格程度。默认为0.5，当这个值越小，通过模糊查找出的文档的匹配程度就越低，文档的数量也就越多；当这个值越大，说明要匹配程度更大，匹配的文档数也就越少，当相似度设置为1，那么就退化为TermQuery查询，所以当这个值>=1或<0会抛出IllegalArgumentException异常。

另外一个参数prefixLength表示在进行模糊匹配的时候，要有多少个前缀字母必须完全匹配。例如当该值设置为“1”，则表示所有此条只有第一个字母与检索关键字相符时，才会被集合选中。

以上程序设置相似度为0.1f,并且匹配第一个字母相符的检索结果。

FuzzyQueryDemo.rar (1.2 KB)
下载次数: 32

分享到：

Lucene 搜索方法（QueryParser） | Lucene 搜索方法（多短语搜索）

2010-12-20 11:54
浏览 3451
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论