【上海校区】Lucene的基本介绍 - 黑马程序员技术交流社区

流程： 1）准备要添加的文档数据：Document 2）初始化索引写出工具：IndexWriter 3）设定索引存储目录Directory 4）设定其他配置：IndexWriterConfig 5）设定分词器：Analyzer 6）设定Lucene版本 7）写出索引2.创建索引的细节 1.覆盖或追加的三种模式 1.1 CREATE：每次写入都覆盖以前的数据 1.2 APPEND：不覆盖数据，而是使用以前的索引数据后追加 1.3 CREATE_OR_APPEND：如果不存在则创建新的，如果存在则追加数据

2.Filed字段类型 2.1 DoubleField、FloatField、IntField、LongField、StringField、TextField这些子类创建的字段一定会被创建索引。但是不一定会被存储到文档列表。要通过构造函数中的参数Store来指定： 2.2 Store.YES代表存储，在搜索结果中也会展示出来 2.3 Store.NO代表不存储，在搜索结果中无法展示 2.4 TextField即创建索引，又会被分词。其它Field会创建索引，但是不会被分词。3.需要注意的问题

问题1：这个字段是否需要创建索引？

如果需要根据这个字段搜索，则这个字段需要创建索引。
无需创建索引：使用StoreField类型
需要创建索引：使用除了StoreField外的其它类型

问题2：这个字段是否需要存储？

如果一个字段要显示到最终的结果中，那么一定要存储，否则就不存储
存储，则使用StoreField或者其它类型字段，但是构造函数第三个参数必须是Store.YES
不存储，必须使用StoreField以外的字段，并且构造函数第三个参数必须是Store.NO

问题3：这个字段是否需要分词？

这个字段首先要需要被搜索，因此剔除了StoreField。然后如果这个字段的值是不可分割的，那么就不需要分词，例如：ID；否则就需要分词
需要分词：使用TextField
不需要分词：使用除TextField外的其它几个类型

其实，这里最关键的是弄清楚一个字段：是否需要存储、是否需要索引、是否需要分词。弄清楚这个，就能知道怎么选择API了。