HA 模式下的 Hadoop2.7.4+ZooKeeper3.4.10搭建

399次阅读

没有评论

共计 12730 个字符，预计需要花费 32 分钟才能阅读完成。

一、概述

本次实验采用 VMware 虚拟机，Linux 版本为 CentOS7；

因为实验所需的 5 台机器配置大多相同，所以采用配置其中一台，然后使用克隆功能复制另外 4 份再做具体修改；

其中有些步骤以前配置过，此处就说明一下不再做具体配置，具体配置可翻阅以前的博文。

二、实验环境

1. 关闭 selinux 和 firewall

2.Hadoop-2.7.4.tar.gz；zookeeper-3.4.10.tar.gz；jdk-8u131-linux-x64.tar.gz

三、主机规划

IP	Host	进程
192.168.100.11	hadoop1	NameNode ResourceManager DFSZKFailoverController
192.168.100.12	hadoop2	NameNode ResourceManager DFSZKFailoverController
192.168.100.13	hadoop3	DataNode NodeManager JournalNode QuorumPeerMain
192.168.100.14	hadoop4	DataNode NodeManager JournalNode QuorumPeerMain
192.168.100.15	hadoop5	DataNode NodeManager JournalNode QuorumPeerMain

四、环境准备
1. 设置 IP 地址：192.168.100.11
2. 设置主机名：hadoop1
3. 设置 IP 和主机名的映射
[root@hadoop1 ~]# cat /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.100.11 hadoop1
192.168.100.12 hadoop2
192.168.100.13 hadoop3
192.168.100.14 hadoop4
192.168.100.15 hadoop5

4. 配置 ssh 分发脚本
5. 解压 jdk
[root@hadoop1 ~]# tar -zxf jdk-8u131-linux-x64.tar.gz
[root@hadoop1 ~]# cp -r jdk1.8.0_131/ /usr/local/jdk

6. 解压 hadoop
[root@hadoop1 ~]# tar -zxf hadoop-2.7.4.tar.gz
[root@hadoop1 ~]# cp -r hadoop-2.7.4 /usr/local/hadoop

7. 解压 zookeeper
[root@hadoop1 ~]# tar -zxf zookeeper-3.4.10.tar.gz
[root@hadoop1 ~]# cp -r zookeeper-3.4.10 /usr/local/hadoop/zookeeper
[root@hadoop1 ~]# cd /usr/local/hadoop/zookeeper/conf/
[root@hadoop1 conf]# cp zoo_sample.cfg zoo.cfg
[root@hadoop1 conf]# vim zoo.cfg
# 修改 dataDir
dataDir=/usr/local/hadoop/zookeeper/data
# 添加下面三行
server.1=hadoop3:2888:3888
server.2=hadoop4:2888:3888
server.3=hadoop5:2888:3888
[root@hadoop1 conf]# cd ..
[root@hadoop1 zookeeper]# mkdir data
# 此处还有操作，但是 hadoop1 上不部署 zookeeper 模块所以后面再修改

8. 配置环境变量

[root@hadoop1 ~]# tail -4 /etc/profile
export Java_HOME=/usr/local/jdk
export HADOOP_HOME=/usr/local/hadoop
export ZOOKEEPER_HOME=/usr/local/hadoop/zookeeper
export PATH=.:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/bin:$ZOOKEEPER_HOME/bin:$PATH
[root@hadoop1 ~]# source /etc/profile

9. 测试环境变量可用

[root@hadoop1 ~]# java -version
java version “1.8.0_131”
Java(TM) SE Runtime Environment (build 1.8.0_131-b11)
Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)
[root@hadoop1 ~]# hadoop version
Hadoop 2.7.4
Subversion Unknown -r Unknown
Compiled by root on 2017-08-28T09:30Z
Compiled with protoc 2.5.0
From source with checksum 50b0468318b4ce9bd24dc467b7ce1148
This command was run using /usr/local/hadoop/share/hadoop/common/hadoop-common-2.7.4.jar

五、配置 hadoop

1.core-site.xml
<configuration>
<!– 指定 hdfs 的 nameservice 为 master –>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master/</value>
</property>
<!– 指定 hadoop 临时目录 –>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
<!– 指定 zookeeper 地址 –>
<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop3:2181,hadoop4:2181,hadoop5:2181</value>
</property>
</configuration>

2.hdfs-site.xml
<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/local/hadoop/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/local/hadoop/dfs/data</value>
</property>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>

<!–HDFS 高可用配置 –>
<!– 指定 hdfs 的 nameservice，需要和 core-site.xml 中的保持一致 –>
<property>
<name>dfs.nameservices</name>
<value>master</value>
</property>
<!– 指定 master 的两个 namenode 的名称 –>
<property>
<name>dfs.ha.namenodes.master</name>
<value>nn1,nn2</value>
</property>

<!– nn1,nn2 rpc 通信地址 –>
<property>
<name>dfs.namenode.rpc-address.master.nn1</name>
<value>hadoop1:9000</value>
</property>
<property>
<name>dfs.namenode.rpc-address.master.nn2</name>
<value>hadoop2:9000</value>
</property>

<!– nn1.nn2 http 通信地址 –>
<property>
<name>dfs.namenode.http-address.master.nn1</name>
<value>hadoop1:50070</value>
</property>
<property>
<name>dfs.namenode.http-address.master.nn2</name>
<value>hadoop2:50070</value>
</property>

<!–=========Namenode 同步 ==========–>
<!– 保证数据恢复 –>
<property>
<name>dfs.journalnode.http-address</name>
<value>0.0.0.0:8480</value>
</property>
<property>
<name>dfs.journalnode.rpc-address</name>
<value>0.0.0.0:8485</value>
</property>
<property>
<!– 指定 NameNode 的元数据在 JournalNode 上的存放位置 –>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://hadoop3:8485;hadoop4:8485;hadoop5:8485/master</value>
</property>

<property>
<!–JournalNode 存放数据地址 –>
<name>dfs.journalnode.edits.dir</name>
<value>/usr/local/hadoop/dfs/journal</value>
</property>
<property>
<!–NameNode 失败自动切换实现方式 –>
<name>dfs.client.failover.proxy.provider.master</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<!–=========Namenode fencing：======== –>
<!– 配置隔离机制方法，多个机制用换行分割，即每个机制暂用一行 –>
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence
shell(/bin/true)</value>
</property>
<!– 使用 sshfence 隔离机制时需要 ssh 免登陆 –>
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>
<!– 配置 sshfence 隔离机制超时时间 –>
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>

<!– 开启基于 Zookeeper 及 ZKFC 进程的自动备援设置, 监视进程是否死掉 –>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop3:2181,hadoop4:2181,hadoop5:2181</value>
</property>
<property>
<!– 指定 ZooKeeper 超时间隔，单位毫秒 –>
<name>ha.zookeeper.session-timeout.ms</name>
<value>2000</value>
</property>
</configuration>

3.yarn-site.xml

<configuration>
<!–NodeManager 上运行的附属服务。需配置成 mapreduce_shuffle，才可运行 MapReduce 程序 –>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.connect.retry-interval.ms</name>
<value>2000</value>
</property>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<!– 指定 RM 的 cluster id –>
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>yrc</value>
</property>
<!– 指定两台 RM 主机名标识符 –>
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<!–RM 主机 1 –>
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>hadoop1</value>
</property>
<!–RM 主机 2 –>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>hadoop2</value>
</property>
<!–RM 故障自动切换 –>
<property>
<name>yarn.resourcemanager.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<!–RM 故障自动恢复 –>
<property>
<name>yarn.resourcemanager.recovery.enabled</name>
<value>true</value>
</property>
<!–RM 状态信息存储方式，一种基于内存 (MemStore)，另一种基于 ZK(ZKStore)–>
<property>
<name>yarn.resourcemanager.store.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>
<!– 指定 zk 集群地址 –>
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>hadoop3:2181,hadoop4:2181,hadoop5:2181</value>
</property>
<!– 向 RM 调度资源地址 –>
<property>
<name>yarn.resourcemanager.scheduler.address.rm1</name>
<value>hadoop1:8030</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address.rm2</name>
<value>hadoop2:8030</value>
</property>
<!–NodeManager 通过该地址交换信息 –>
<property>
<name>yarn.resourcemanager.resource-tracker.address.rm1</name>
<value>hadoop1:8031</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address.rm2</name>
<value>hadoop2:8031</value>
</property>
<!– 客户端通过该地址向 RM 提交对应用程序操作 –>
<property>
<name>yarn.resourcemanager.address.rm1</name>
<value>hadoop1:8032</value>
</property>
<property>
<name>yarn.resourcemanager.address.rm2</name>
<value>hadoop2:8032</value>
</property>
<!– 管理员通过该地址向 RM 发送管理命令 –>
<property>
<name>yarn.resourcemanager.admin.address.rm1</name>
<value>hadoop1:8033</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address.rm2</name>
<value>hadoop2:8033</value>
</property>
<!–RM HTTP 访问地址, 查看集群信息 –>
<property>
<name>yarn.resourcemanager.webapp.address.rm1</name>
<value>hadoop1:8088</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address.rm2</name>
<value>hadoop2:8088</value>
</property>
</configuration>

4.mapred-site.xml
<configuration>
<!– 指定 mr 框架为 yarn 方式 –>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<!– 配置 MapReduce JobHistory Server 地址，默认端口 10020 –>
<property>
<name>mapreduce.jobhistory.address</name>
<value>hadoop1:10020</value>
</property>
<!– 配置 MapReduce JobHistory Server HTTP 地址，默认端口 19888 –>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop1:19888</value>
</property>
</configuration>

5.slaves
[root@hadoop1 hadoop]# cat slaves
hadoop3
hadoop4
hadoop5

6.hadoop-env.sh
export JAVA_HOME=/usr/local/jdk #在后面添加

六、克隆虚拟机
1. 使用 hadoop1 为模板克隆 4 台虚拟机，并将网卡的 MAC 地址重新生成

2. 修改主机名为 hadoop2-hadoop5
3. 修改 IP 地址
4. 配置所有机器之间的 ssh 免密登陆（ssh 公钥分发）

七、配置 zookeeper
[root@hadoop3 ~]# echo 1 > /usr/local/hadoop/zookeeper/data/myid #在 hadoop3 上
[root@hadoop4 ~]# echo 2 > /usr/local/hadoop/zookeeper/data/myid #在 hadoop4 上
[root@hadoop5 ~]# echo 3 > /usr/local/hadoop/zookeeper/data/myid #在 hadoop5 上

八、启动集群
1. 在 hadoop3- 5 上启动 zookeeper
[root@hadoop3 ~]# zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /usr/local/hadoop/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper … STARTED
[root@hadoop3 ~]# zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/hadoop/zookeeper/bin/../conf/zoo.cfg
Mode: follower
[root@hadoop3 ~]# jps
2184 QuorumPeerMain
2237 Jps
#hadoop4 和 hadoop5 相同操作

2. 在 hadoop1 上格式化 ZooKeeper 集群
[root@hadoop1 ~]# hdfs zkfc -formatZK

3. 在 hadoop3- 5 上启动 journalnode
[root@hadoop3 ~]# hadoop-daemon.sh start journalnode
starting journalnode, logging to /usr/local/hadoop/logs/hadoop-root-journalnode-hadoop3.out
[root@hadoop3 ~]# jps
2244 JournalNode
2293 Jps
2188 QuorumPeerMain

4. 在 hadoop1 上格式化 namenode
[root@hadoop1 ~]# hdfs namenode -format
…
17/08/29 22:53:30 INFO util.ExitUtil: Exiting with status 0
17/08/29 22:53:30 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at hadoop1/192.168.100.11
************************************************************/

5. 在 hadoop1 上启动刚格式化的 namenode

[root@hadoop1 ~]# hadoop-daemon.sh start namenode
starting namenode, logging to /usr/local/hadoop/logs/hadoop-root-namenode-hadoop1.out
[root@hadoop1 ~]# jps
2422 Jps
2349 NameNode

6. 在 hadoop2 上同步 nn1（hadoop1）数据到 nn2（hadoop2）
12345678910 [root@hadoop2 ~]# hdfs namenode -bootstrapStandby
…
17/08/29 22:55:45 INFO namenode.TransferFsImage: Image Transfer timeout configured to 60000 milliseconds
17/08/29 22:55:45 INFO namenode.TransferFsImage: Transfer took 0.00s at 0.00 KB/s
17/08/29 22:55:45 INFO namenode.TransferFsImage: Downloaded file fsimage.ckpt_0000000000000000000 size 321 bytes.
17/08/29 22:55:45 INFO util.ExitUtil: Exiting with status 0
17/08/29 22:55:45 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at hadoop2/192.168.100.12
************************************************************/

7. 启动 hadoop2 上的 namenode
[root@hadoop2 ~]# hadoop-daemon.sh start namenode

8. 启动集群中的所有服务
[root@hadoop1 ~]# start-all.sh

9. 在 hadoop2 上启动 yarn
[root@hadoop2 ~]# yarn-daemon.sh start resourcemanager

10. 开启 historyserver
[root@hadoop1 ~]# mr-jobhistory-daemon.sh start historyserver
starting historyserver, logging to /usr/local/hadoop/logs/mapred-root-historyserver-hadoop1.out
[root@hadoop1 ~]# jps
3026 DFSZKFailoverController
3110 ResourceManager
3894 JobHistoryServer
3927 Jps
2446 NameNode

11. 查看进程
[root@hadoop3 ~]# jps
2480 DataNode
2722 Jps
2219 JournalNode
2174 QuorumPeerMain
2606 NodeManager
[root@hadoop4 ~]# jps
2608 NodeManager
2178 QuorumPeerMain
2482 DataNode
2724 Jps
2229 JournalNode
[root@hadoop5 ~]# jps
2178 QuorumPeerMain
2601 NodeManager
2475 DataNode
2717 Jps
2223 JournalNode

九、测试
1. 连接

HA 模式下的 Hadoop2.7.4+ZooKeeper3.4.10 搭建

2.kill hadoop2 上的 namenode
[root@hadoop2 ~]# jps
2742 NameNode
3016 DFSZKFailoverController
4024 JobHistoryServer
4057 Jps
3133 ResourceManager
[root@hadoop2 ~]# kill -9 2742
[root@hadoop2 ~]# jps
3016 DFSZKFailoverController
3133 ResourceManager
4205 Jps

HA 模式下的 Hadoop2.7.4+ZooKeeper3.4.10 搭建

Hadoop 项目之基于 CentOS7 的 Cloudera 5.10.1（CDH）的安装部署 http://www.linuxidc.com/Linux/2017-04/143095.htm

Hadoop2.7.2 集群搭建详解（高可用）http://www.linuxidc.com/Linux/2017-03/142052.htm

使用 Ambari 来部署 Hadoop 集群（搭建内网 HDP 源）http://www.linuxidc.com/Linux/2017-03/142136.htm

Ubuntu 14.04 下 Hadoop 集群安装 http://www.linuxidc.com/Linux/2017-02/140783.htm

CentOS 6.7 安装 Hadoop 2.7.2 http://www.linuxidc.com/Linux/2017-08/146232.htm

Ubuntu 16.04 上构建分布式 Hadoop-2.7.3 集群 http://www.linuxidc.com/Linux/2017-07/145503.htm

CentOS 7.3 下 Hadoop2.8 分布式集群安装与测试 http://www.linuxidc.com/Linux/2017-09/146864.htm

CentOS 7 下 Hadoop 2.6.4 分布式集群环境搭建 http://www.linuxidc.com/Linux/2017-06/144932.htm

Hadoop2.7.3+Spark2.1.0 完全分布式集群搭建过程 http://www.linuxidc.com/Linux/2017-06/144926.htm

更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

本文永久更新链接地址 ：http://www.linuxidc.com/Linux/2017-10/147644.htm