阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

MongoDB3.4的sharding集群搭建及JavaAPI的简易使用

448次阅读
没有评论

共计 5738 个字符,预计需要花费 15 分钟才能阅读完成。

第一部分

在搭建 mongoDB 之前,我们要考虑几个小问题:

1、我们搭建集群的目的是什么?是多备份提高容错和系统可用性还是横向拓展存储大规模数据还是两者兼有?

如果是为了多备份那么选择 replication 集群搭建即可,如果是为了处理大数据则需要搭建 sharding 集群,如果两者兼有需要对每个 shardsvr 创建 replica。

2、什么是 sharding?和 replication 有什么不同?

简单而言,replica 是 mongo 提供服务的一个基本单位,单机系统和 replication 集群对用户来讲没有区别,都只相当于一个服务节点,只不过 replication 集群有多备份,还有服务端选举,安全性更加有保证。而 sharding 集群包含 3 个角色:mongos,configsvr,shardsvr,对于一个集群来说 mongos 相当于 master,负责对外提供服务,shardsvr 相当于 slave,负责分片存储数据,而 configsvr 相当于 router,负责记录分片元信息。这 3 种角色中的任何一个角色中的子节点都是一个 replica。具体说明参考官方网站对 sharding 和 replication 的描述:

replication:https://docs.mongodb.com/manual/replication/

sharding:https://docs.mongodb.com/manual/sharding/

3、我们集群的架构又该是什么样子?

如果对问题 1 和 2 有足够的认知的话,那么根据本地硬件环境构建一个什么样的集群大致也就清楚了,每个 shardsvr 的 replication 相当于一个 slave,我们需要几个子节点就需要创建多少个 shardsvr,configsvr 是 router 信息,我们可以将所有机器都组成一个 configsvr 的 replication 用以提供 router 服务,至于 mongos,内部使用一个节点也可以,如果需要稳定运行的话也需要组一个小的 mongos 的 replication。

 第二部分

下面是实战环节:

我这可以有 5 台服务器用来跑 mongodb 还有一批数据,当然,这 5 台机器上也跑着其他框架如 spark,Hadoop 等等,由于 spark 和 hadoop 都是单点故障的(什么?多 master?secondary? 不存在的,老夫部署集群从来都是单点故障)所以 mongos 也是一台节点,数据端存放在 5 台机器上,又由于数据量较大,硬盘较小(别人组的 raid5,加一起一台服务器也就 1T 多空间),所以肯定不考虑备份和稳定性了(2 备份硬盘就没多大地方了,hdfs 还有其他数据要放),那么架构可以构建如下:

MongoDB3.4 的 sharding 集群搭建及 JavaAPI 的简易使用

 

下面 shardsvr 每一个都是一个单独的 replica,开始部署:

1、创建配置文件:

a)configsvr

systemLog:
   destination: file
   path: "/home/cloud/platform/logs/mongodb/configsvr.log"
   logAppend: true
storage:
   dbPath: "/home/cloud/platform/data/configData"
   journal:
      enabled: true
setParameter:
   enableLocalhostAuthBypass: false
processManagement:
   fork: true
replication:
   replSetName: "configsvr0"
sharding:
   clusterRole: "configsvr"

b)shardsvr

systemLog:
   destination: file
   path: "/home/cloud/platform/logs/mongodb/shardsvr.log"
   logAppend: true
storage:
   dbPath: "/home/cloud/platform/data/shardData"
   journal:
      enabled: true
setParameter:
   enableLocalhostAuthBypass: false
processManagement:
   fork: true
replication:
   replSetName: "shardsvr1"
sharding:
   clusterRole: "shardsvr"

c)mongos

systemLog:
   destination: file
   path: "/home/cloud/platform/logs/mongodb/mongos.log"
   logAppend: true
net:
   bindIp: 192.168.12.161
   port: 27017
setParameter:
   enableLocalhostAuthBypass: false
processManagement:
   fork: true
sharding:
   configDB: "configsvr0/192.168.12.161:27019,192.168.12.162:27019,192.168.12.163:27019,192.168.12.164:27019,192.168.12.169:27019"

注意:每台机器上的配置都略有不同,简易参考官方文档进行修改,replSetName 这个是 replication 的设置,每个角色的子 replication 应该有相同的值,不同的 replication 应该有不同的值

接下来是启动脚本

a)shardsvr

#!/bin/bash

# use this to initiate: rs.initiate({_id:"shardsvr1",members:[{_id:0,host:"192.168.12.161:27018"}]})
/home/cloud/platform/mongodb-3.4.5/bin/mongod --config /home/cloud/platform/mongodb-3.4.5/shardserver.conf

b)configsvr

#!/bin/bash

#use this to initiate: rs.initiate({_id:"configsvr0",configsvr:true,members:[{_id:0,host:"192.168.12.161:27019"},{_id:1,host:"192.168.12.162:27019"},{_id:2,host:"192.168.12.163:27019"},{_id:3,host:"192.168.12.164:27019"},{_id:4,host:"192.168.12.169:27019"}]})

MONGO_HOME=/home/cloud/platform/mongodb-3.4.5/
${MONGO_HOME}/bin/mongod --config ${MONGO_HOME}/configserver.conf

c)mongos

#!/bin/bash

#mogos dont need to initiate,
#sh.enableSharding("dbname") to create database
#sh.shardCollection("dbname.tablename", {id: "hashed"}) to create a shard table split by id


/home/cloud/platform/mongodb-3.4.5/bin/mongos --config /home/cloud/platform/mongodb-3.4.5/mongosserver.conf

2、启动过程

a、将脚本和配置文件复制到每台机器上

b、启动每个 shardsvr,然后登录到 shardsvr 上,执行初始化过程:

1、执行 start-shardsvr.sh
2、执行 bin/mongo --host ${hostIP} --port ${hostport}
    shardsvr 的默认端口是 27018
    configsvr 的默认端口是 27019
    mongos 的默认端口是 27017
    在上面配置文件中未指定端口,一切都以默认为主
3、执行 rs.initiate({_id:"shardsvr1",members:[{_id:0,host:"192.168.12.161:27018"}]})
    进行初始化工作
4、执行 rs.status()查看 shardsvr 状态,一个成功的例子如下:

MongoDB3.4 的 sharding 集群搭建及 JavaAPI 的简易使用

c、启动所有 configsvr,并使用 mongo –host –port 命令登录到任意一台 configsvr 的 configsvr 端口上(default:27019)。并执行初始化工作:

rs.initiate({_id:"configsvr0",configsvr:true,members:[{_id:0,host:"192.168.12.161:27019"},{_id:1,host:"192.168.12.162:27019"},{_id:2,host:"192.168.12.163:27019"},{_id:3,host:"192.168.12.164:27019"},{_id:4,host:"192.168.12.169:27019"}]})

d、启动 mongos,这时已经可以在 mongos 上执行我们的操作了。

// 先添加 shard 分片,如果 shardsvr1 有多个节点也只用写一个,毕竟一个 replica 相当于一个节点,使用时会自动找到 primary 的
sh.addShard("shardsvr1/192.168.12.161:27018"))
// 把所有的都加进去之后
printShardingStatus()

 MongoDB3.4 的 sharding 集群搭建及 JavaAPI 的简易使用

然后就是正常的 mongo shell 操作了,可以把 mongos 当成一个普通的单机 mongodb 来使用,操作基本相同,除了创建 sharding 表

创建表如下:

sh.enableSharding("dbname") to create database
sh.shardCollection("dbname.tablename", {"_id": "hashed"}) to create a shard table hashed by _id

需要注意的是,”_id” 是 mongo 分片依据,不能重复,如果想以其他字段来进行 hash,将命令中的 ”_id” 改为字段名称就可以了,但是 mongo 还是会自动创建一个_id 列用来索引

添加索引:

db.collectionname.ensureIndex({"indexColumn":1})

第三部分

JavaAPI 小 tips

获取连接:

lazy val mongo = new MongoClient("192.168.12.161", 27017)
lazy val db = mongo.getDatabase("testdb")
lazy val dbColl = db.getCollection("origin2")

插入数据:

var resList = new ArrayList[Document]
var d = new Document
d.append("path", x.getPath)
d.append("name", x.getName)
d.append("content", filterHtml(Source.fromFile(x, detector(x)).getLines().toArray).mkString("\n"))
resList.add(d)
dbColl.insertMany(resList, new InsertManyOptions().ordered(false))

在插入过程中,如果 ”_id” 出现重复值,那么默认情况下会中止当前插入操作并 throw 一个 exception,即之前的数据已经插入进去,后面的数据没插入进表,在后面加入 new InsertManyOptions().ordered(false)参数就可以将所有不重复的数据插入完成后再 throw 一个 exception

更多 MongoDB 相关教程见以下内容

MongoDB 文档、集合、数据库简介  http://www.linuxidc.com/Linux/2016-12/138529.htm

MongoDB 3 分片部署及故障模拟验证  http://www.linuxidc.com/Linux/2016-12/138529.htm

Linux CentOS 6.5 yum 安装 MongoDB  http://www.linuxidc.com/Linux/2016-12/137790.htm

CentOS 7 yum 方式快速安装 MongoDB  http://www.linuxidc.com/Linux/2016-11/137679.htm

MongoDB 的查询操作  http://www.linuxidc.com/Linux/2016-10/136581.htm

在 Azure 虚拟机上快速搭建 MongoDB 集群  http://www.linuxidc.com/Linux/2017-09/146778.htm

MongoDB 复制集原理  http://www.linuxidc.com/Linux/2017-09/146670.htm

MongoDB 3.4 远程连接认证失败  http://www.linuxidc.com/Linux/2017-06/145070.htm

Ubuntu 16.04 中安装 MongoDB3.4 数据库系统  http://www.linuxidc.com/Linux/2017-07/145526.htm

MongoDB 权威指南第 2 版 PDF 完整带书签目录 下载见 http://www.linuxidc.com/Linux/2016-12/138253.htm

MongoDB 的详细介绍:请点这里
MongoDB 的下载地址:请点这里

本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-12/149538.htm

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-22发表,共计5738字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

星哥玩云

星哥玩云
星哥玩云
分享互联网知识
用户数
4
文章数
19348
评论数
4
阅读量
7795220
文章搜索
热门文章
开发者必备神器:阿里云 Qoder CLI 全面解析与上手指南

开发者必备神器:阿里云 Qoder CLI 全面解析与上手指南

开发者必备神器:阿里云 Qoder CLI 全面解析与上手指南 大家好,我是星哥。之前介绍了腾讯云的 Code...
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
云服务器部署服务器面板1Panel:小白轻松构建Web服务与面板加固指南

云服务器部署服务器面板1Panel:小白轻松构建Web服务与面板加固指南

云服务器部署服务器面板 1Panel:小白轻松构建 Web 服务与面板加固指南 哈喽,我是星哥,经常有人问我不...
我把用了20年的360安全卫士卸载了

我把用了20年的360安全卫士卸载了

我把用了 20 年的 360 安全卫士卸载了 是的,正如标题你看到的。 原因 偷摸安装自家的软件 莫名其妙安装...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
阿里云CDN
阿里云CDN-提高用户访问的响应速度和成功率
随机文章
还在找免费服务器?无广告免费主机,新手也能轻松上手!

还在找免费服务器?无广告免费主机,新手也能轻松上手!

还在找免费服务器?无广告免费主机,新手也能轻松上手! 前言 对于个人开发者、建站新手或是想搭建测试站点的从业者...
150元打造低成本NAS小钢炮,捡一块3865U工控板

150元打造低成本NAS小钢炮,捡一块3865U工控板

150 元打造低成本 NAS 小钢炮,捡一块 3865U 工控板 一块二手的熊猫 B3 工控板 3865U,搭...
安装Black群晖DSM7.2系统安装教程(在Vmware虚拟机中、实体机均可)!

安装Black群晖DSM7.2系统安装教程(在Vmware虚拟机中、实体机均可)!

安装 Black 群晖 DSM7.2 系统安装教程(在 Vmware 虚拟机中、实体机均可)! 前言 大家好,...
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
开源神器组合!1Panel面板+Halo助你轻松打造个人/企业内容中心

开源神器组合!1Panel面板+Halo助你轻松打造个人/企业内容中心

开源神器组合!1Panel 面板 +Halo 助你轻松打造个人 / 企业内容中心 前言 大家好,我是星哥,之前...

免费图片视频管理工具让灵感库告别混乱

一言一句话
-「
手气不错
150元打造低成本NAS小钢炮,捡一块3865U工控板

150元打造低成本NAS小钢炮,捡一块3865U工控板

150 元打造低成本 NAS 小钢炮,捡一块 3865U 工控板 一块二手的熊猫 B3 工控板 3865U,搭...
【开源神器】微信公众号内容单篇、批量下载软件

【开源神器】微信公众号内容单篇、批量下载软件

【开源神器】微信公众号内容单篇、批量下载软件 大家好,我是星哥,很多人都希望能高效地保存微信公众号的文章,用于...
恶意团伙利用 PHP-FPM 未授权访问漏洞发起大规模攻击

恶意团伙利用 PHP-FPM 未授权访问漏洞发起大规模攻击

恶意团伙利用 PHP-FPM 未授权访问漏洞发起大规模攻击 PHP-FPM(FastCGl Process M...
星哥带你玩飞牛NAS硬件 01:捡垃圾的最爱双盘,暴风二期矿渣为何成不老神话?

星哥带你玩飞牛NAS硬件 01:捡垃圾的最爱双盘,暴风二期矿渣为何成不老神话?

星哥带你玩飞牛 NAS 硬件 01:捡垃圾的最爱双盘,暴风二期矿渣为何成不老神话? 前言 在选择 NAS 用预...
浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍

浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍

浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍 前言 在 AI 自动化快速发展的当下,浏览器早已不再只是...