本帖最后由 我是楠楠 于 2018-5-16 14:39 编辑
【郑州校区】Lucene&Solr(2)下
1.1. Solr后台管理
1.1.1. 管理界面1.1.2. Dashboard仪表盘,显示了该Solr实例开始启动运行的时间、版本、系统资源、jvm等信息。 1.1.3. LoggingSolr运行日志信息 1.1.4. CloudCloud即SolrCloud,即Solr云(集群),当使用Solr Cloud模式运行时会显示此菜单,如下图是Solr Cloud的管理界面: 1.1.5. Core AdminSolr Core的管理界面。Solr Core 是Solr的一个独立运行实例单位,它可以对外提供索引和搜索服务,一个Solr工程可以运行多个SolrCore(Solr实例),一个Core对应一个索引目录。 添加solrcore: 第一步:复制collection1改名为collection2 第二步:修改core.properties。name=collection2 第三步:重启tomcat 1.1.6. java propertiesSolr在JVM 运行环境中的属性信息,包括类路径、文件编码、jvm内存设置等信息。 1.1.7. Tread Dump显示Solr Server中当前活跃线程信息,同时也可以跟踪线程运行栈信息。 1.1.8. Core selector选择一个SolrCore进行详细操作,如下: 1.1.9. Analysis通过此界面可以测试索引分析器和搜索分析器的执行情况。 1.1.10. Dataimport可以定义数据导入处理器,从关系数据库将数据导入 到Solr索引库中。 1.1.11. Document通过此菜单可以创建索引、更新索引、删除索引等操作,界面如下: /update表示更新索引,solr默认根据id(唯一约束)域来更新Document的内容,如果根据id值搜索不到id域则会执行添加操作,如果找到则更新。 1.1.12. Query 通过/select执行搜索索引,必须指定“q”查询条件方可搜索。 1.2. 配置中文分析器
1.2.1. Schema.xmlschema.xml,在SolrCore的conf目录下,它是Solr数据表配置文件,它定义了加入索引的数据的数据类型的。主要包括FieldTypes、Fields和其他的一些缺省设置。 FieldType域类型定义下边“text_general”是Solr默认提供的FieldType,通过它说明FieldType定义的内容: FieldType子结点包括:name,class,positionIncrementGap等一些参数: name:是这个FieldType的名称 class:是Solr提供的包solr.TextField,solr.TextField 允许用户通过分析器来定制索引和查询,分析器包括一个分词器(tokenizer)和多个过滤器(filter) positionIncrementGap:可选属性,定义在同一个文档中此类型数据的空白间隔,避免短语匹配错误,此值相当于Lucene的短语查询设置slop值,根据经验设置为100。 在FieldType定义的时候最重要的就是定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer,包括分词和过滤 索引分析器中:使用solr.StandardTokenizerFactory标准分词器,solr.StopFilterFactory停用词过滤器,solr.LowerCaseFilterFactory小写过滤器。 搜索分析器中:使用solr.StandardTokenizerFactory标准分词器,solr.StopFilterFactory停用词过滤器,这里还用到了solr.SynonymFilterFactory同义词过滤器。 Field定义在fields结点内定义具体的Field,filed定义包括name,type(为之前定义过的各种FieldType),indexed(是否被索引),stored(是否被储存),multiValued(是否存储多个值)等属性。 如下: <field name="name" type="text_general" indexed="true" stored="true"/> <field name="features" type="text_general" indexed="true" stored="true" multiValued="true"/> multiValued:该Field如果要存储多个值时设置为true,solr允许一个Field存储多个值,比如存储一个用户的好友id(多个),商品的图片(多个,大图和小图),通过使用solr查询要看出返回给客户端是数组: uniqueKeySolr中默认定义唯一主键key为id域,如下: Solr在删除、更新索引时使用id域进行判断,也可以自定义唯一主键。 注意在创建索引时必须指定唯一约束。 copyField复制域copyField复制域,可以将多个Field复制到一个Field中,以便进行统一的检索: 比如,输入关键字搜索title标题内容content, 定义title、content、text的域: 根据关键字只搜索text域的内容就相当于搜索title和content,将title和content复制到text中,如下: dynamicField(动态字段)动态字段就是不用指定具体的名称,只要定义字段名称的规则,例如定义一个 dynamicField,name 为*_i,定义它的type为text,那么在使用这个字段的时候,任何以_i结尾的字段都被认为是符合这个定义的,例如:name_i,gender_i,school_i等。 自定义Field名为:product_title_t,“product_title_t”和scheam.xml中的dynamicField规则匹配成功,如下: “product_title_t”是以“_t”结尾。 创建索引: 搜索索引: 1.2.2. 安装中文分词器使用IKAnalyzer中文分析器。 第一步:把IKAnalyzer2012FF_u1.jar添加到solr/WEB-INF/lib目录下。 第二步:复制IKAnalyzer的配置文件和自定义词典和停用词词典到solr的classpath下。 第三步:在schema.xml中添加一个自定义的fieldType,使用中文分析器。 <!-- IKAnalyzer--> <fieldType name="text_ik" class="solr.TextField"> <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType> |
第四步:定义field,指定field的type属性为text_ik <!--IKAnalyzer Field--> <field name="title_ik" type="text_ik" indexed="true" stored="true" /> <field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/> |
第四步:重启tomcat 测试: 1.3. 设置业务系统Field如果不使用Solr提供的Field可以针对具体的业务需要自定义一套Field,如下是商品信息Field: <!--product--> <field name="product_name" type="text_ik" indexed="true" stored="true"/> <field name="product_price" type="float" indexed="true" stored="true"/> <field name="product_description" type="text_ik" indexed="true" stored="false" /> <field name="product_picture" type="string" indexed="false" stored="true" /> <field name="product_catalog_name" type="string" indexed="true" stored="true" /> <field name="product_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/> <copyField source="product_name" dest="product_keywords"/> <copyField source="product_description" dest="product_keywords"/> 更多 传智播客·黑马程序员郑州校区地址 河南省郑州市 高新区长椿路11号大学科技园(西区)东门8号楼三层 联系电话 0371-56061160/61/62 来校路线 地铁一号线梧桐街站A口出
|