1. Solr安装与配置 1.1 什么是 Solr 大多数搜索引擎应用都必须具有某种搜索功能,问题是搜索功能往往是巨大的资源消耗并且它们由于沉重的数据库加载而拖垮你的应用的性能。
这就是为什么转移负载到一个外部的搜索服务器是一个不错的主意,Apache Solr 是一个流行的开源搜索服务器,它通过使用类似 REST 的 HTTP API,这就确保你能从几乎任何编程语言来使用 solr。
Solr 是一个开源搜索平台,用于构建搜索应用程序。 它建立在 Lucene(全文搜索引擎) 之上。 Solr 是企业级的,快速的和高度可扩展的。 使用 Solr 构建的应用程序非常复杂,可提供高性能。 为了在 CNET 网络的公司网站上添加搜索功能,Yonik Seely 于 2004 年创建了 Solr。并在 2006 年 1 月,它成为 Apache 软件基金会下的一个开源项目。并于 2016 年发布最新版本 Solr 6.0,支持并行 SQL 查询的执行。
Solr 可以和 Hadoop一起使用。由于 Hadoop 处理大量数据,Solr 帮助我们从这么大的源中找到所需的信息。不仅限于搜索,Solr 也可以用于存储目的。像其他 NoSQL 数据库一样, 它是一种非关系数据存储和处理技术。
总之,Solr 是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的数据。
1.2 Solr安装 1:安装 Tomcat,解压缩即可。 2:解压 solr。 3:把 solr 下的 dist 目录 solr-4.10.3.war 部署到 Tomcat\webapps 下(去掉版本号)。 4:启动 Tomcat 解压缩 war 包
5:把solr 下example/lib/ext 目录下的所有的 jar 包,添加到 solr 的工程中(\WEB-INF\lib目录下)。
6:创建一个 solrhome 。solr 下的/example/solr 目录就是一个 solrhome。复制此目录到 D 盘改名为 solrhome 7:关联 solr 及 solrhome。需要修改 solr 工程的 web.xml 文件。 [AppleScript] 纯文本查看 复制代码 <env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>d:\solrhome</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry> 8:启动 Tomcat http://IP:8080/solr/ 1.2 中文分析器 IKAnalyzer 1.2.1 IK Analyzer 简介IK Analyzer 是一个开源的,基亍 java 语言开发的轻量级的中文分词工具包。从 2006 年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开源项目 Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始, IK 发展为面向 Java 的公用分词组件,独立亍 Lucene 项目,同时提供了对 Lucene 的默认优化实现。在 2012 版本中,IK 实现了简单的分词歧义排除算法,标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。 1.2.2 IK Analyzer 配置步骤: 1、把 IKAnalyzer2012FF_u1.jar 添加到 solr 工程的 lib 目录下 2、创建 WEB-INF/classes 文件夹 把扩展词典、停用词词典、配置文件放到 solr 工程的 WEB-INF/classes 目录下。 3、修改 Solrhome 的 schema.xml 文件,配置一个 FieldType,使用 IKAnalyzer [AppleScript] 纯文本查看 复制代码 <fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType> 1.4 配置域域相当于数据库的表字段,用户存放数据,因此用户根据业务需要去定义相关的 Field (域),一般来说,每一种对应着一种数据,用户对同一种数据进行相同的操作。 域的常用属性: · name:指定域的名称 · type:指定域的类型 · indexed:是否索引 · stored:是否存储 · required:是否必须 · multiValued:是否多值 1.4.1 域修改 solrhome 的 schema.xml 文件 设置业务系统 Field [AppleScript] 纯文本查看 复制代码 <field name="item_goodsid" type="long" indexed="true" stored="true"/>
<field name="item_title" type="text_ik" indexed="true" stored="true"/>
<field name="item_price" type="double" indexed="true" stored="true"/>
<field name="item_image" type="string" indexed="false" stored="true" />
<field name="item_category" type="string" indexed="true" stored="true" />
<field name="item_seller" type="text_ik" indexed="true" stored="true" />
<field name="item_brand" type="string" indexed="true" stored="true" /> 1.4.1 复制域复制域的作用在于将某一个 Field 中的数据复制到另一个域中 1.4.1 动态域当我们需要动态扩充字段时,我们需要使用动态域。对于品优购,规格的值是不确定的, 所以我们需要使用动态域来实现。需要实现的效果如下: 配置: [AppleScript] 纯文本查看 复制代码 <dynamicField name="item_spec_*" type="string" indexed="true" stored="true" />
|