阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

Solr4.6用csv文件导入数据

120次阅读
没有评论

共计 1838 个字符,预计需要花费 5 分钟才能阅读完成。

安装好了 solr4.6,今天尝试了下给 collection1 核用 csv 文件批量导入数据。

首先写好 csv 文件(book.csv),这个文件的路径随意放。我的路径是:E:/book.csv。并注意文件的编码,我的编码是 GB2312,一会儿上传的时候要用,如果错了,中文会乱码。

id;title;content
16;” 除夕 ”;” 某主席上台了,除夕就不放假了。”
17;” 钓鱼岛 ”;” 钓鱼岛是中国的,苍井空是世界的 ”

然后修改 schema.xml。把 fields 里面的已经定义好的字段全部清空,但是 ”_version_”,和”_root_“元素保留。字段定义如下:

<field name=”id” type=”string” stored=”true” indexed=”true”/>
<field name=”title” type=”string” stored=”true” indexed=”true”/>
<field name=”content” type=”string” stored=”true” indexed=”true”/>

还需要修改 solrconfig.xml。

将下面的这一段:

 <requestHandler name=”/update/csv” class=”solr.CSVRequestHandler”>
        <lst name=”defaults”>
        <str name=”stream.contentType”>application/csv</str>
      </lst>
  </requestHandler>

替换为:

<requestHandler name=”/update/csv” class=”solr.CSVRequestHandler” startup=”lazy”>
  <lst name=”defaults”>
    <str name=”separator”>;</str>
    <str name=”header”>true</str>
    <str name=”encapsulator”>”</str>
  </lst>
 </requestHandler>

separator 字段表示每行数据各个字段是用分号分开的。

所有的修改完之后,重启 tomcat。如果是 windows 下,直接在浏览器地址栏里执行下面这个 http 请求即可:

http://localhost:8080/solr/update/csv?commit=true&stream.file=E:/book.csv&stream.contentType=text/plain;
charset=GB2312

说明一下,commit=true 这个必须有,不然插入数据不会成功。E:/book.csv,这个是文件的绝对路径。;charset=GB2312 这个是我的 csv 文件的文件编码方式,这个一定要弄清楚,否则中文乱码。

执行完之后,查看结果:

Solr4.6 用 csv 文件导入数据

Solr 的详细介绍 :请点这里
Solr 的下载地址 :请点这里

相关阅读:

Solr3.6.1 在 Tomcat6 下的环境搭建 http://www.linuxidc.com/Linux/2013-01/77664.htm

基于 Tomcat 的 Solr3.5 集群部署 http://www.linuxidc.com/Linux/2012-12/75297.htm

在 Linux 上使用 Nginx 为 Solr 集群做负载均衡 http://www.linuxidc.com/Linux/2012-12/75257.htm

Linux 下安装使用 Solr http://www.linuxidc.com/Linux/2012-10/72029.htm

在 Ubuntu 12.04 LTS 上通过 Tomcat 部署 Solr 4 http://www.linuxidc.com/Linux/2012-09/71158.htm

Solr 实现 Low Level 查询解析(QParser)http://www.linuxidc.com/Linux/2012-05/59755.htm

基于 Solr 3.5 搭建搜索服务器 http://www.linuxidc.com/Linux/2012-05/59743.htm

Solr 3.5 开发应用教程 PDF 高清版 http://www.linuxidc.com/Linux/2013-10/91048.htm

Solr 4.0 部署实例教程 http://www.linuxidc.com/Linux/2013-10/91041.htm

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-20发表,共计1838字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中