阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

CentOS7下搭建Solr 6.6全文检索服务器及IK分词器配置

151次阅读
没有评论

共计 6660 个字符,预计需要花费 17 分钟才能阅读完成。

详细介绍在 CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置过程步骤,希望对大家有所帮助。

1. 安装准备

下载 Tomcat8.5 和 solr6.6 上传文件到 CentOS 并解压:
安装前请确保 CentOS 已安装过 jdk。

[root@localhost solr]# Java -version
java version "1.8.0_131"
Java(TM) SE Runtime Environment (build 1.8.0_131-b11)
Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)

查看:


tar -zxvf apache-tomcat-8.5.16.tar.gz
tar -zxvf solr-6.6.0.tgz

[root@localhost solr]# ls
apache-tomcat-8.5.16  apache-tomcat-8.5.16.tar.gz  solr-6.6.0  solr-6.6.0.tgz

2. 安装过程

将 solr 压缩包中 solr\server\solr-webapp\ 文件夹下有个 webapp 文件夹,将之复制到 tomcat\webapps\ 目录下,文件夹名改成 solr(可任意);

[root@localhost apache-tomcat-8.5.16]# cd /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/
[root@localhost webapps]# ls
docs  examples  host-manager  manager  ROOT  solr

将 solr 压缩包中 solr\server\lib\ext 中的 jar 全部复制到 Tomcat\ webapps\solr\WEB-INF\lib 目录中。

[root@localhost lib]# cp /usr/yong.cao/dev/solr/solr-6.6.0/server/lib/ext/* /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/lib/

将 solr 压缩包中 solr/server/lib/metrics* 开头的 jar 全部复制到 Tomcat\ webapps\solr\WEB-INF\lib 目录中。

[root@localhost lib]# pwd
/usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/lib
[root@localhost lib]# cp /usr/yong.cao/dev/solr/solr-6.6.0/server/lib/metrics* .

在 Tomcat\ webapps\solr\WEB-INF\ 下建立 classes 目录,并将 solr/server/resources/log4j.properties 文件复制其中。

cp log4j.properties /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/classes/

复制 solr/server/solr/* 所有文件到 tomcat/solrhome 目录,用到创建 solr 的 core 时使用。

cp -rf * /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/solrhome/

配置 Solr

编辑 web.xml 文件:
配置 solr 下 core 路径,初始状态下该内容是被注释掉的。

<env-entry>
    <env-entry-name>solr/home</env-entry-name>
        <env-entry-value>/usr/yong.cao/dev/solr/apache-tomcat-8.5.16/solrhome</env-entry-value>
    <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

配置访问权限:找到如下内容,并注释掉:

<!--
  <security-constraint>
    <web-resource-collection>
      <web-resource-name>Disable TRACE</web-resource-name>
      <url-pattern>/</url-pattern>
      <http-method>TRACE</http-method>
    </web-resource-collection>
    <auth-constraint/>
  </security-constraint>
  <security-constraint>
    <web-resource-collection>
      <web-resource-name>Enable everything but TRACE</web-resource-name>
      <url-pattern>/</url-pattern>
      <http-method-omission>TRACE</http-method-omission>
    </web-resource-collection>
  </security-constraint>
  -->

设置 solr 开机启动:

vim /etc/rc.local

在后面添加:

export JAVA_HOME=/usr/java/jdk1.8.0_131
sh /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/bin/startup.sh

3. 运行 Solr

启动:

/usr/yong.cao/dev/solr/apache-tomcat-8.5.16/bin/startup.sh

访问 solr 服务器:
http://192.168.128.128:8080/solr/index.html
CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置

创建 core:
1. 新建 collection1
2.solrhome\configsets\sample_techproducts_configs 文件夹,将此文件夹下的 conf 目录拷贝到刚刚建立的 collection1 的文件夹下。

[root@localhost sample_techproducts_configs]# cd /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/solrhome/

[root@localhost solrhome]# mkdir collection1

[root@localhost collection1]# cp -r /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/solrhome/configsets/sample_techproducts_configs/conf/ .

3. 访问管理页面,Add Core。
CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置
4. 输入 collection1 做为 name 和 instanceDir
CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置

4.IK 中文分词器配置

下载 solr6.6IK 分词器

—————————————— 分割线 ——————————————

可以到 Linux 公社 1 号 FTP 服务器下载

FTP 地址:ftp://ftp1.linuxidc.com

用户名:ftp1.linuxidc.com

密码:www.linuxidc.com

在 2017 年 LinuxIDC.com//12 月 /CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置 /

下载方法见 http://www.linuxidc.com/Linux/2013-10/91140.htm

—————————————— 分割线 —————————————— 

下载后上传到 CentOS 并解压。

[root@localhost solr]# mkdir ik
[root@localhost solr]# cd ik/
[root@localhost ik]# cp /usr/yong.cao/ftp/ikanalyzer-solr6.6.zip .
[root@localhost ik]# ls
ikanalyzer-solr6.6.zip
[root@localhost ik]# unzip ikanalyzer-solr6.6.zip
Archive:  ikanalyzer-solr6.6.zip
   creating: ikanalyzer-solr5/
  inflating: ikanalyzer-solr5/ext.dic
  inflating: ikanalyzer-solr5/IKAnalyzer.cfg.xml
  inflating: ikanalyzer-solr5/stopword.dic
  inflating: ikanalyzer-solr5/solr-analyzer-ik-5.1.0.jar
  inflating: ikanalyzer-solr5/ik-analyzer-solr5-5.x.jar
[root@localhost ik]# ls
ikanalyzer-solr5  ikanalyzer-solr6.6.zip

将文件夹下的 IKAnalyzer.cfg.xml , ext.dic 和 stopword.dic 三个文件 复制到 /webapps/solr/WEB-INF/classes 目录下。

[root@localhost ikanalyzer-solr5]# cp ext.dic stopword.dic IKAnalyzer.cfg.xml /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/classes/

修改 IKAnalyzer.cfg.xml(提供的下载包中该处已做修改)

<properties>
        <comment>IK Analyzer 扩展配置</comment>
        <!-- 用户可以在这里配置自己的扩展字典 -->
        <entry key="ext_dict">ext.dic;</entry>

        <!-- 用户可以在这里配置自己的扩展停止词字典 -->
        <entry key="ext_stopwords">stopword.dic;</entry>

</properties>

复制 solr-analyzer-ik-5.1.0.jar ik-analyzer-solr5-5.x.jar 到 /solr/apache-tomcat-8.5.12/webapps/solr/WEB-INF/lib/ 目录下。

[root@localhost ik]# ls
ikanalyzer-solr5  ikanalyzer-solr6.6.zip

[root@localhost ik]# cd ikanalyzer-solr5/

[root@localhost ikanalyzer-solr5]# ls
ext.dic             ik-analyzer-solr5-5.x.jar   stopword.dic
IKAnalyzer.cfg.xml  solr-analyzer-ik-5.1.0.jar

[root@localhost ikanalyzer-solr5]# cp ik-analyzer-solr5-5.x.jar solr-analyzer-ik-5.1.0.jar /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/lib/

在 solrhome\collection1\conf\managed-schema 文件前增加如下配置

<!-- IK 分词器 -->
    <fieldType name="text_ik" class="solr.TextField">
      <analyzer type="index">
          <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
        </analyzer>
        <analyzer type="query">
          <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
      </analyzer>
    </fieldType>

命令操作如下:

[root@localhost ikanalyzer-solr5]# cp ik-analyzer-solr5-5.x.jar solr-analyzer-ik                                                                                        -5.1.0.jar /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/lib/

[root@localhost ikanalyzer-solr5]# cd /usr/yong.cao/dev/solr/apache-tomcat-8.5.1                                                                                        6/solrhome/collection1/conf/

[root@localhost conf]# ls
admin-extra.html              protwords.txt
admin-extra.menu-bottom.html  _rest_managed.json
admin-extra.menu-top.html     _schema_analysis_stopwords_english.json
clustering                    _schema_analysis_synonyms_english.json
currency.xml                  solrconfig.xml
elevate.xml                   spellings.txt
lang                          stopwords.txt
managed-schema                synonyms.txt
mapping-FoldToASCII.txt       update-script.js
mapping-ISOLatin1Accent.txt   velocity
params.json                   xslt

[root@localhost conf]# vim managed-schema

重启 solr 服务器,测试 IK 分词效果。

sh /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/bin/shutdown.sh
sh /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/bin/startup.sh

CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置

更多 Solr 相关教程见以下内容

Solr3.6.1 在 Tomcat6 下的环境搭建 http://www.linuxidc.com/Linux/2013-01/77664.htm

Apache Solr: 安装和运行 http://www.linuxidc.com/Linux/2016-12/138527.htm

在 Ubuntu 12.04 LTS 上通过 Tomcat 部署 Solr 4 http://www.linuxidc.com/Linux/2012-09/71158.htm

Solr 实现 Low Level 查询解析(QParser)http://www.linuxidc.com/Linux/2012-05/59755.htm

Solr6.0.0 + Tomcat8 配置问题 http://www.linuxidc.com/Linux/2016-05/131845.htm

基于 Solr 3.5 搭建搜索服务器 http://www.linuxidc.com/Linux/2012-05/59743.htm

Solr 3.5 开发应用教程 PDF 高清版 http://www.linuxidc.com/Linux/2013-10/91048.htm

CentOS 6.7 下单机部署 Solr 7.1.0  http://www.linuxidc.com/Linux/2017-12/149889.htm

Solr 4.0 部署实例教程 http://www.linuxidc.com/Linux/2013-10/91041.htm

Solr 的详细介绍:请点这里
Solr 的下载地址:请点这里

本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-12/149897.htm

正文完
星哥说事-微信公众号
post-qrcode
 
星锅
版权声明:本站原创文章,由 星锅 2022-01-21发表,共计6660字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中