[Lucene]核心类和概念介绍

本文介绍: 先上一个使用Lucene读写文件的DEMO。

先上一个使用Lucene读写文件的DEMO

import java.io.IOException;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.RAMDirectory;
public class IndexAndSearchExample {
    public static void main(String[] args) throws IOException {
        // 创建内存中的索引目录
        Directory indexDir = new RAMDirectory();

        // 创建分词器。
        Analyzer analyzer = new StandardAnalyzer();

        // 配置IndexWriter
        IndexWriterConfig config = new IndexWriterConfig(analyzer);
        //IndexWriter构建时会检查目录下是否有索引，没有则写入新索引。如果有则只向索引添加内容
        IndexWriter writer = new IndexWriter(indexDir, config);

        // 创建文档
        Document doc1 = new Document();
        doc1.add(new TextField("title", "Lucene in Action", Field.Store.YES));
        doc1.add(new TextField("description", "Lucene is a powerful search library", Field.Store.YES));
        writer.addDocument(doc1);

        Document doc2 = new Document();
        doc2.add(new TextField("title", "Java Development with Ant", Field.Store.YES));
        doc2.add(new TextField("description", "Learn how to use Ant to build, test, and deploy your Java applications", Field.Store.YES));
        writer.addDocument(doc2);

        // 提交文档，IndexWriter会向Directory提交写入变化。IndexWriter还可以继续使用
        writer.commit();
        //关闭IndexWriter.也会触发提交文档
        writer.close();

        // 创建IndexSearcher，能够对指定Directory搜索
        DirectoryReader reader = DirectoryReader.open(indexDir);
        IndexSearcher searcher = new IndexSearcher(reader);

        // 构建查询
        Query query = new TermQuery(new Term("title", "lucene"));

        // 执行查询
        ScoreDoc[] hits = searcher.search(query, 10).scoreDocs;

        // 遍历结果
        for (ScoreDoc hit : hits) {
            Document result = searcher.doc(hit.doc);
            System.out.println(result.get("title") + " : " + result.get("description"));
        }

        // 关闭IndexReader
        reader.close();
    }
}

索引文件所在目录，存储一批文件的抽象层。提供文件增删查改的方法。

分词器。用于将text分割成更小的term（词汇单元），还可能会执行大小写转换、无用词删除等操作

document组成部分,有name,type,value属性。值可以是string、number、byte[]。包含以下实例化选项

索引和查询的单元，由一些field组成