阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

CentOS7下搭建Solr 6.6全文检索服务器及IK分词器配置

458次阅读
没有评论

共计 6660 个字符,预计需要花费 17 分钟才能阅读完成。

详细介绍在 CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置过程步骤,希望对大家有所帮助。

1. 安装准备

下载 Tomcat8.5 和 solr6.6 上传文件到 CentOS 并解压:
安装前请确保 CentOS 已安装过 jdk。

[root@localhost solr]# Java -version
java version "1.8.0_131"
Java(TM) SE Runtime Environment (build 1.8.0_131-b11)
Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)

查看:


tar -zxvf apache-tomcat-8.5.16.tar.gz
tar -zxvf solr-6.6.0.tgz

[root@localhost solr]# ls
apache-tomcat-8.5.16  apache-tomcat-8.5.16.tar.gz  solr-6.6.0  solr-6.6.0.tgz

2. 安装过程

将 solr 压缩包中 solr\server\solr-webapp\ 文件夹下有个 webapp 文件夹,将之复制到 tomcat\webapps\ 目录下,文件夹名改成 solr(可任意);

[root@localhost apache-tomcat-8.5.16]# cd /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/
[root@localhost webapps]# ls
docs  examples  host-manager  manager  ROOT  solr

将 solr 压缩包中 solr\server\lib\ext 中的 jar 全部复制到 Tomcat\ webapps\solr\WEB-INF\lib 目录中。

[root@localhost lib]# cp /usr/yong.cao/dev/solr/solr-6.6.0/server/lib/ext/* /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/lib/

将 solr 压缩包中 solr/server/lib/metrics* 开头的 jar 全部复制到 Tomcat\ webapps\solr\WEB-INF\lib 目录中。

[root@localhost lib]# pwd
/usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/lib
[root@localhost lib]# cp /usr/yong.cao/dev/solr/solr-6.6.0/server/lib/metrics* .

在 Tomcat\ webapps\solr\WEB-INF\ 下建立 classes 目录,并将 solr/server/resources/log4j.properties 文件复制其中。

cp log4j.properties /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/classes/

复制 solr/server/solr/* 所有文件到 tomcat/solrhome 目录,用到创建 solr 的 core 时使用。

cp -rf * /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/solrhome/

配置 Solr

编辑 web.xml 文件:
配置 solr 下 core 路径,初始状态下该内容是被注释掉的。

<env-entry>
    <env-entry-name>solr/home</env-entry-name>
        <env-entry-value>/usr/yong.cao/dev/solr/apache-tomcat-8.5.16/solrhome</env-entry-value>
    <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

配置访问权限:找到如下内容,并注释掉:

<!--
  <security-constraint>
    <web-resource-collection>
      <web-resource-name>Disable TRACE</web-resource-name>
      <url-pattern>/</url-pattern>
      <http-method>TRACE</http-method>
    </web-resource-collection>
    <auth-constraint/>
  </security-constraint>
  <security-constraint>
    <web-resource-collection>
      <web-resource-name>Enable everything but TRACE</web-resource-name>
      <url-pattern>/</url-pattern>
      <http-method-omission>TRACE</http-method-omission>
    </web-resource-collection>
  </security-constraint>
  -->

设置 solr 开机启动:

vim /etc/rc.local

在后面添加:

export JAVA_HOME=/usr/java/jdk1.8.0_131
sh /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/bin/startup.sh

3. 运行 Solr

启动:

/usr/yong.cao/dev/solr/apache-tomcat-8.5.16/bin/startup.sh

访问 solr 服务器:
http://192.168.128.128:8080/solr/index.html
CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置

创建 core:
1. 新建 collection1
2.solrhome\configsets\sample_techproducts_configs 文件夹,将此文件夹下的 conf 目录拷贝到刚刚建立的 collection1 的文件夹下。

[root@localhost sample_techproducts_configs]# cd /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/solrhome/

[root@localhost solrhome]# mkdir collection1

[root@localhost collection1]# cp -r /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/solrhome/configsets/sample_techproducts_configs/conf/ .

3. 访问管理页面,Add Core。
CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置
4. 输入 collection1 做为 name 和 instanceDir
CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置

4.IK 中文分词器配置

下载 solr6.6IK 分词器

—————————————— 分割线 ——————————————

可以到 Linux 公社 1 号 FTP 服务器下载

FTP 地址:ftp://ftp1.linuxidc.com

用户名:ftp1.linuxidc.com

密码:www.linuxidc.com

在 2017 年 LinuxIDC.com//12 月 /CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置 /

下载方法见 http://www.linuxidc.com/Linux/2013-10/91140.htm

—————————————— 分割线 —————————————— 

下载后上传到 CentOS 并解压。

[root@localhost solr]# mkdir ik
[root@localhost solr]# cd ik/
[root@localhost ik]# cp /usr/yong.cao/ftp/ikanalyzer-solr6.6.zip .
[root@localhost ik]# ls
ikanalyzer-solr6.6.zip
[root@localhost ik]# unzip ikanalyzer-solr6.6.zip
Archive:  ikanalyzer-solr6.6.zip
   creating: ikanalyzer-solr5/
  inflating: ikanalyzer-solr5/ext.dic
  inflating: ikanalyzer-solr5/IKAnalyzer.cfg.xml
  inflating: ikanalyzer-solr5/stopword.dic
  inflating: ikanalyzer-solr5/solr-analyzer-ik-5.1.0.jar
  inflating: ikanalyzer-solr5/ik-analyzer-solr5-5.x.jar
[root@localhost ik]# ls
ikanalyzer-solr5  ikanalyzer-solr6.6.zip

将文件夹下的 IKAnalyzer.cfg.xml , ext.dic 和 stopword.dic 三个文件 复制到 /webapps/solr/WEB-INF/classes 目录下。

[root@localhost ikanalyzer-solr5]# cp ext.dic stopword.dic IKAnalyzer.cfg.xml /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/classes/

修改 IKAnalyzer.cfg.xml(提供的下载包中该处已做修改)

<properties>
        <comment>IK Analyzer 扩展配置</comment>
        <!-- 用户可以在这里配置自己的扩展字典 -->
        <entry key="ext_dict">ext.dic;</entry>

        <!-- 用户可以在这里配置自己的扩展停止词字典 -->
        <entry key="ext_stopwords">stopword.dic;</entry>

</properties>

复制 solr-analyzer-ik-5.1.0.jar ik-analyzer-solr5-5.x.jar 到 /solr/apache-tomcat-8.5.12/webapps/solr/WEB-INF/lib/ 目录下。

[root@localhost ik]# ls
ikanalyzer-solr5  ikanalyzer-solr6.6.zip

[root@localhost ik]# cd ikanalyzer-solr5/

[root@localhost ikanalyzer-solr5]# ls
ext.dic             ik-analyzer-solr5-5.x.jar   stopword.dic
IKAnalyzer.cfg.xml  solr-analyzer-ik-5.1.0.jar

[root@localhost ikanalyzer-solr5]# cp ik-analyzer-solr5-5.x.jar solr-analyzer-ik-5.1.0.jar /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/lib/

在 solrhome\collection1\conf\managed-schema 文件前增加如下配置

<!-- IK 分词器 -->
    <fieldType name="text_ik" class="solr.TextField">
      <analyzer type="index">
          <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
        </analyzer>
        <analyzer type="query">
          <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
      </analyzer>
    </fieldType>

命令操作如下:

[root@localhost ikanalyzer-solr5]# cp ik-analyzer-solr5-5.x.jar solr-analyzer-ik                                                                                        -5.1.0.jar /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/webapps/solr/WEB-INF/lib/

[root@localhost ikanalyzer-solr5]# cd /usr/yong.cao/dev/solr/apache-tomcat-8.5.1                                                                                        6/solrhome/collection1/conf/

[root@localhost conf]# ls
admin-extra.html              protwords.txt
admin-extra.menu-bottom.html  _rest_managed.json
admin-extra.menu-top.html     _schema_analysis_stopwords_english.json
clustering                    _schema_analysis_synonyms_english.json
currency.xml                  solrconfig.xml
elevate.xml                   spellings.txt
lang                          stopwords.txt
managed-schema                synonyms.txt
mapping-FoldToASCII.txt       update-script.js
mapping-ISOLatin1Accent.txt   velocity
params.json                   xslt

[root@localhost conf]# vim managed-schema

重启 solr 服务器,测试 IK 分词效果。

sh /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/bin/shutdown.sh
sh /usr/yong.cao/dev/solr/apache-tomcat-8.5.16/bin/startup.sh

CentOS7 下搭建 Solr 6.6 全文检索服务器及 IK 分词器配置

更多 Solr 相关教程见以下内容

Solr3.6.1 在 Tomcat6 下的环境搭建 http://www.linuxidc.com/Linux/2013-01/77664.htm

Apache Solr: 安装和运行 http://www.linuxidc.com/Linux/2016-12/138527.htm

在 Ubuntu 12.04 LTS 上通过 Tomcat 部署 Solr 4 http://www.linuxidc.com/Linux/2012-09/71158.htm

Solr 实现 Low Level 查询解析(QParser)http://www.linuxidc.com/Linux/2012-05/59755.htm

Solr6.0.0 + Tomcat8 配置问题 http://www.linuxidc.com/Linux/2016-05/131845.htm

基于 Solr 3.5 搭建搜索服务器 http://www.linuxidc.com/Linux/2012-05/59743.htm

Solr 3.5 开发应用教程 PDF 高清版 http://www.linuxidc.com/Linux/2013-10/91048.htm

CentOS 6.7 下单机部署 Solr 7.1.0  http://www.linuxidc.com/Linux/2017-12/149889.htm

Solr 4.0 部署实例教程 http://www.linuxidc.com/Linux/2013-10/91041.htm

Solr 的详细介绍:请点这里
Solr 的下载地址:请点这里

本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-12/149897.htm

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-21发表,共计6660字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

星哥玩云

星哥玩云
星哥玩云
分享互联网知识
用户数
4
文章数
19351
评论数
4
阅读量
7993234
文章搜索
热门文章
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
我把用了20年的360安全卫士卸载了

我把用了20年的360安全卫士卸载了

我把用了 20 年的 360 安全卫士卸载了 是的,正如标题你看到的。 原因 偷摸安装自家的软件 莫名其妙安装...
再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见 zabbix!轻量级自建服务器监控神器在 Linux 的完整部署指南 在日常运维中,服务器监控是绕不开的...
飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛 NAS 中安装 Navidrome 音乐文件中文标签乱码问题解决、安装 FntermX 终端 问题背景 ...
阿里云CDN
阿里云CDN-提高用户访问的响应速度和成功率
随机文章
国产开源公众号AI知识库 Agent:突破未认证号限制,一键搞定自动回复,重构运营效率

国产开源公众号AI知识库 Agent:突破未认证号限制,一键搞定自动回复,重构运营效率

国产开源公众号 AI 知识库 Agent:突破未认证号限制,一键搞定自动回复,重构运营效率 大家好,我是星哥,...
每年0.99刀,拿下你的第一个顶级域名,详细注册使用

每年0.99刀,拿下你的第一个顶级域名,详细注册使用

每年 0.99 刀,拿下你的第一个顶级域名,详细注册使用 前言 作为长期折腾云服务、域名建站的老玩家,星哥一直...
如何免费使用强大的Nano Banana Pro?附赠邪修的用法

如何免费使用强大的Nano Banana Pro?附赠邪修的用法

如何免费使用强大的 Nano Banana Pro?附赠邪修的用法 前言 大家好,我是星哥,今天来介绍谷歌的 ...
12.2K Star 爆火!开源免费的 FileConverter:右键一键搞定音视频 / 图片 / 文档转换,告别多工具切换

12.2K Star 爆火!开源免费的 FileConverter:右键一键搞定音视频 / 图片 / 文档转换,告别多工具切换

12.2K Star 爆火!开源免费的 FileConverter:右键一键搞定音视频 / 图片 / 文档转换...
从“纸堆”到“电子化”文档:用这个开源系统打造你的智能文档管理系统

从“纸堆”到“电子化”文档:用这个开源系统打造你的智能文档管理系统

从“纸堆”到“电子化”文档:用这个开源系统打造你的智能文档管理系统 大家好,我是星哥。公司的项目文档存了一堆 ...

免费图片视频管理工具让灵感库告别混乱

一言一句话
-「
手气不错
支付宝、淘宝、闲鱼又双叕崩了,Cloudflare也瘫了连监控都挂,根因藏在哪?

支付宝、淘宝、闲鱼又双叕崩了,Cloudflare也瘫了连监控都挂,根因藏在哪?

支付宝、淘宝、闲鱼又双叕崩了,Cloudflare 也瘫了连监控都挂,根因藏在哪? 最近两天的互联网堪称“故障...
手把手教你,购买云服务器并且安装宝塔面板

手把手教你,购买云服务器并且安装宝塔面板

手把手教你,购买云服务器并且安装宝塔面板 前言 大家好,我是星哥。星哥发现很多新手刚接触服务器时,都会被“选购...
把小米云笔记搬回家:飞牛 NAS 一键部署,小米云笔记自动同步到本地

把小米云笔记搬回家:飞牛 NAS 一键部署,小米云笔记自动同步到本地

把小米云笔记搬回家:飞牛 NAS 一键部署,小米云笔记自动同步到本地 大家好,我是星哥,今天教大家在飞牛 NA...
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸

一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸

一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸 前言 作为天天跟架构图、拓扑图死磕的...
4盘位、4K输出、J3455、遥控,NAS硬件入门性价比之王

4盘位、4K输出、J3455、遥控,NAS硬件入门性价比之王

  4 盘位、4K 输出、J3455、遥控,NAS 硬件入门性价比之王 开篇 在 NAS 市场中,威...