CentOS 6.9下搭建Hadoop 2.8 完全分布式集群

共计 20720 个字符，预计需要花费 52 分钟才能阅读完成。

最近在 CentOS 机器上搭建了 Apache Hadoop 分布式集群，采用了最新的 2.8 稳定版本，并配置了 NameNode、ResourceManager 的 HA 高可用，方便日常对 Hadoop 的研究与测试工作。详细的搭建过程如下：

1、安装 docker，创建 docker 容器，用于搭建 hadoop 节点

docker 真是个好东西啊，当要在自己的笔记本上搭建分布式集群时，由于 CPU、内存、磁盘有限，无法在 VMware 上虚拟出太多节点，这时使用 docker 创建几个容器，就能轻松搭建一个分布式集群了。

（1）先在 VMware 上安装 CentOS 6.9，作为宿主机，然后安装 docker，具体过程见 http://www.linuxidc.com/Linux/2018-02/150834.htm

（2）然后再 docker hub 中拉取 centos 镜像，用于创建分布式集群的节点，推荐在 Docker 中安装 CentOS 6，具体过程见 http://www.linuxidc.com/Linux/2018-02/15083.htm

（3）centos 镜像准备好后，就开始创建 docker 容器，用于搭建 hadoop 的节点

# 创建 4 个节点，用于搭建 hadoop
docker run -it --name hadoopcentos1 centos:6 /bin/bash
docker run -it --name hadoopcentos2 centos:6 /bin/bash
docker run -it --name hadoopcentos3 centos:6 /bin/bash
docker run -it --name hadoopcentos4 centos:6 /bin/bash

# 启动容器
docker start hadoopcentos1
docker start hadoopcentos2
docker start hadoopcentos3
docker start hadoopcentos4

注意：这时要把宿主机的防火墙关掉、selinux 设为不可用

# 关掉防火墙
chkconfig iptables off
service iptables stop

# 设置 selinux 为不可用，在 config 文件中修改 SELINUX 配置项
vi /etc/selinux/config

SELINUX=disabled

2、规划 hadoop 集群

本次共创建了 4 个 hadoop 节点，并实现 NameNode HA、ResourceManager HA，节点规划如下

hadoop 集群节点规划

Docker 容器	ip 地址	主机名	节点进程
hadoopcentos1	172.17.0.1	hd1	NameNode（active）、JournalNode、Zookeeper、ZKFC
hadoopcentos2	172.17.0.2	hd2	NameNode（standby）、JournalNode、Zookeeper、ZKFC、NodeManager、DataNode
hadoopcentos3	172.17.0.3	hd3	ResourceManager（active）、JournalNode、Zookeeper、NodeManager、DataNode
hadoopcentos4	172.17.0.4	hd4	ResourceManager（standby）、NodeManager、DataNode

NameNode HA 部署在 hd1、hd2，ResourceManager HA 部署在 hd3、hd4，其它进程见上表

3、配置 Docker 容器基本环境

由于在 Docker 中拉取的 centos 6 镜像是精简版本，很多指令没有，因此，先安装一些软件，配置基本环境

进入 Docker 容器，例如 hadoopcentos1

docker exec -it hadoopcentos1 bin/bash

更换 yum 国内源（每个节点）

curl http://mirrors.aliyun.com/repo/Centos-6.repo > /etc/yum.repos.d/CentOS-Base-6-aliyun.repo
mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bak
yum clean all
yum makecache

安装相关的软件（每个节点）

yum install -y net-tools which openssh-clients openssh-server iproute.x86_64

编辑 sshd_config 文件，将其中的 UsePAM 改成 no

vi /etc/ssh/sshd_config

启动 ssh（每个节点）

chkconfig sshd on
service sshd start

创建用于安装 apache hadoop 的组、账号

groupadd ahadoop
useradd -m -g ahadoop ahadoop

配置主机名映射表

vi /etc/hosts
172.17.0.1	hd1.hdsite	hd1
172.17.0.2  hd2.hdsite  hd2
172.17.0.3  hd3.hdsite  hd3
172.17.0.4  hd4.hdsite  hd4
172.17.0.1	31d48048cb1e
172.17.0.2	1620d6ed305d
172.17.0.3	ed3702f8924e
172.17.0.4	ee8319514df6

其中，最后 4 行的随机字符串，就是 docker 容器自动生成的主机名了，每生成一个 docker 容器就会自动生成一个主机名

4、安装 JDK

从 Oracle 的官网上面下载 JDK 1.8 Linux x64

创建 java 目录，并解压安装（使用 root 用户，方便以后别的程序也可以用）

mkdir /usr/java
cd /usr/java
tar -zxvf jdk-8u131-linux-x64.tar.gz

5、下载 apache hadoop

从 apache hadoop 的官网上面下载最新的稳定版本 apache hadoop 2.8

切换到 ahadoop 用户，将 hadoop 2.8 放于 /home/ahadoop 目录中，并解压

su ahadoop
cd /home/ahadoop
tar -zxvf hadoop-2.8.0.tar.gz

6、配置 zookeeper

要实现 hadoop namenode HA 高可用，且实现故障的自动切换，则要借助于 zookeeper

注意：如果只是实现 namenode HA 高可用，是可以不用 zookeeper 的，只要配置 hadoop 的 journalnode 节点即可实现高可用。而配置 zookeeper 集群，主要是为了监控心跳，实现故障时自动切换，这才是我们配置 HA 高可用的重要目标。

（1）下载 zookeeper

到 apache zookeeper 官方下载最新版本的 zookeeper-3.4.10.tar.gz

（2）配置 zookeeper

配置之前，建议阅读下apache zookeeper 官方的配置安装介绍

zookeeper 集群只能配置奇数个节点，例如 3、5、7……，至少要 3 个及以上，这跟 zookeeper 的保障机制有关，要确保大多数节点可用，即（n-1）/2，因此节点数必须是奇数

解压 zookeeper（hd1，hd2，hd3）

cd /home/ahadoop
tar -zxvf zookeeper-3.4.10.tar.gz

创建 zookeeper 数据文件（hd1，hd2，hd3），其中不同的节点使用 myid 进行区分，一般使用 1、2、3……

mkdir /home/ahadoop/zookeeper-data
echo '1' > /home/ahadoop/zookeeper-data/myid
echo '2' > /home/ahadoop/zookeeper-data/myid
echo '3' > /home/ahadoop/zookeeper-data/myid

配置 zoo.cfg 配置文件

vi /home/ahadoop/zookeeper-3.4.10/conf/zoo.cfg
dataDir=/home/ahadoop/zookeeper-data	# 修改 zookeeper 数据目录
clientPort=2181				# 默认端口
server.1=hd1:2888:3888
server.2=hd2:2888:3888
server.3=hd3:2888:3888

其中 server.1、server.2、server.3 里面的 server.x 最后的序号则是不同节点的 myid 文件里面的 id

到此，zookeeper 已经配置完毕，使用 zkServer.sh start 命令在每个节点启动 zookeeper（hd1，hd2，hd3）

使用 zkServer.sh status 即可查看节点的状态，最后的 Mode 表示该节点在集群中的角色，一个 zookeeper 集群只有一个 leader，其它都是 follower

[ahadoop@31d48048cb1e ~]$ zkServer.sh start &
[1] 6855
[ahadoop@31d48048cb1e ~]$ ZooKeeper JMX enabled by default
Using config: /home/ahadoop/zookeeper-3.4.10/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED

[1]+  Done                    zkServer.sh start
[ahadoop@1620d6ed305d ~]$
[ahadoop@1620d6ed305d ~]$
[ahadoop@1620d6ed305d ~]$ zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /home/ahadoop/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: leader

7、配置 hadoop 的配置文件

配置 hadoop 集群前，建议先阅读下 apache hadoop 官网的集群配置说明，虽然是英文文档，但是简单易懂，有助于进一步了解 hadoop 集群知识，官方的配置介绍如下（p.s. 参照官网里面的配置说明进行配置，发现有小部分错误，直到实际配置时才发现，下面会介绍）：

apache hadoop 单节点配置官方介绍

apache hadoop 集群配置官方介绍

apache hadoop namenode HA（基于 QJM）配置官方介绍

apache hadoop resourcemanager HA 配置官方介绍

（1）创建相应的文件夹（每个节点）

mkdir /home/ahadoop/hadoop-data
mkdir /home/ahadoop/hadoop-data/name
mkdir /home/ahadoop/hadoop-data/data
mkdir /home/ahadoop/hadoop-data/checkpoint
mkdir /home/ahadoop/hadoop-data/tmp
mkdir /home/ahadoop/hadoop-data/log
mkdir /home/ahadoop/hadoop-data/journalnode

主文件夹为 hadoop-data，其中：

name：存放 namenode 的数据

data：存放 datanode 的数据

checkpoint：存在 namenode 的 checkpoint 数据

tmp：临时文件

log：存放日志

journalnode：存在 jounalnode 的数据

（2）配置 core-site.xml 配置文件

官方提供了默认的 core-default.xml 配置文件 可供参考，但内容很多，我们可根据需要进行配置

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://hdcluster</value>
  </property>
  <property>
    <name>dfs.journalnode.edits.dir</name>
    <value>/home/ahadoop/hadoop-data/journalnode</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/home/ahadoop/hadoop-data/tmp</value>
  </property>
  <property>
    <name>fs.trash.interval</name>
    <value>1440</value>
  </property>
  <property>
    <name>io.file.buffer.size</name>
    <value>65536</value>
  </property>
  <property>
    <name>ha.zookeeper.quorum</name>
    <value>hd1:2181,hd2:2181,hd3:2181</value>
  </property>
</configuration>

其中，

fs.defaultFS：表示集群 namenode 的地址，对于 namenode HA 来说，需要取一个 cluster id 来作区分，以便于区分跟 hadoop 联邦的其它 namenode，这里取 hdcluster 作为该集群的 ID

dfs.journalnode.edits.dir、hadoop.tmp.dir：表示 journalnode 的数据文件路径、临时文件路径

fs.trash.interval：表示回收站的保留时间（分钟），也即 hdfs 的文件删除后，在回收站里面保留的时长

io.file.buffer.size：表示读取文件的字节数（byte）

ha.zookeeper.quorum：表示 zookeeper 集群的主机与端口

（3）配置 hdfs-site.xml 配置文件

官方提供了默认的 hdfs-default.xml 配置文件 可供参考，根据需要进行配置如下

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>3</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/home/ahadoop/hadoop-data/name</value>
  </property>
  <property>
    <name>dfs.blocksize</name>
    <value>67108864</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/home/ahadoop/hadoop-data/data</value>
  </property>
  <property>
    <name>dfs.namenode.checkpoint.dir</name>
    <value>/home/ahadoop/hadoop-data/checkpoint</value>
  </property>
  <property>
    <name>dfs.namenode.handler.count</name>
    <value>10</value>
  </property>
  <property>
    <name>dfs.datanode.handler.count</name>
    <value>10</value>
  </property>
  <property>
    <name>dfs.nameservices</name>
    <value>hdcluster</value>
  </property>
  <property>
    <name>dfs.ha.namenodes.hdcluster</name>
    <value>nn1,nn2</value>
  </property>
  <property>
    <name>dfs.namenode.rpc-address.hdcluster.nn1</name>
    <value>hd1:9000</value>
  </property>
  <property>
    <name>dfs.namenode.rpc-address.hdcluster.nn2</name>
    <value>hd2:9000</value>
  </property>
  <property>
    <name>dfs.namenode.http-address.hdcluster.nn1</name>
    <value>hd1:50070</value>
  </property>
  <property>
    <name>dfs.namenode.http-address.hdcluster.nn2</name>
    <value>hd2:50070</value>
  </property>
  <property>
    <name>dfs.namenode.shared.edits.dir</name>
    <value>qjournal://hd1:8485;hd2:8485;hd3:8485/hdcluster</value>
  </property>
  <property>
    <name>dfs.client.failover.proxy.provider.hdcluster</name>
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
  </property>
  <property>
    <name>dfs.ha.automatic-failover.enabled.hdcluster</name>
    <value>true</value>
  </property>
  <property>
    <name>dfs.ha.fencing.methods</name>
    <value>shell(/bin/true)</value>
  </property>
</configuration>

其中：

dfs.replication：表示 hdfs 的数据块备份数量，默认是 3

dfs.namenode.name.dir，dfs.datanode.data.dir，dfs.namenode.checkpoint.dir：表示 namenode、datanode、checkpoint 的数据路径

dfs.blocksize：表示数据块的大小，默认为 64M，可根据需要改为 128M，甚至 256M

dfs.namenode.handler.count、dfs.datanode.handler.count：表示在 namenode、datanode 的进程数

dfs.nameservices：表示集群 namenode 的 ID，这里命名为 hdcluster，注意要跟 core-size.xml 里面的配置项 fs.defaultFS 中的集群 ID 一致

dfs.ha.namenodes.hdcluster：表示 namenode 的 id，这里有两个 namenode 节点，因此使用 nn1，nn2 命名

dfs.namenode.rpc-address.hdcluster.nn1，dfs.namenode.rpc-address.hdcluster.nn2：表示 nn1、nn2 的远程调用主机和端口

dfs.namenode.http-address.hdcluster.nn1，dfs.namenode.http-address.hdcluster.nn2：表示 nn1、nn2 的所在节点 http 服务和端口

dfs.namenode.shared.edits.dir：表示 namenode 共享的元数据路径，在配置 HA 时，使用 journalnode 来保存元数据，维持 namenode 元数据的一致性

dfs.client.failover.proxy.provider.hdcluster：表示 HDFS 客户端连接到 Active NameNode 的一个 java 类（默认）

dfs.ha.automatic-failover.enabled.hdcluster：表示当 namenode ha 的 active namenode 出现故障时，是否自动切换（当然要设置为 true 了，^^）

dfs.ha.fencing.methods：表示故障时自动切换使用的方法

【敲黑板，注意了同学们，以下是重点】官方给的例子配置值是 sshfence，但经试验，使用这种方式根本就不会自动切换，而是 namenode active 故障时，namenode standby 仍旧是 standby，只有我们登陆到 namenode active 故障节点，再将故障的 namenode 重新恢复启动后，原先的 namenode standby 才会自动切换为 namenode active，（心中突然万马奔腾啊……），这根本不是我们配置高可用的目的啊

经研究，fencing 的方法目前有两种：sshfence 和 shell。其中：

sshfence 方法：是指通过 ssh 登陆到 active namenode 节点杀掉 namenode 进程，所以还需要设置 ssh 无密码登陆，还要保证有杀掉 namenode 进程的权限
shell 方法：是指运行一个 shell 脚本 / 命令来防止两个 namenode 同时处于 active，脚本需要自己写。但其实 QJM 模式本身就有 fencing 功能，能保证只有一个 namenode 能往 journalnode 上写 edits 文件，所以是不需要设置 fencing 的方法就能实现的。但是，在发生 failover 的时候，原来的 active namenode 可能还在接受客户端的读请求，这样客户端很可能读到一些过时的数据（因为新的 active namenode 的数据已经实时更新了）。因此，还是建议设置 fencing 方法。如果确实不想设置 fencing 方法，可以设置一个能返回成功（没有 fencing 作用）的方法，如“shell(/bin/true)”。这个纯粹为了 fencing 方法能够成功返回，并不需要真的有 fencing 作用。这样可以提高系统的可用性，即使在 fencing 机制失败的时候还能保持系统的可用性。

（4）配置 mapred-site.xml

官方提供了默认的 mapred-default.xml 配置文件 可供参考，我们的配置如下

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

该配置表示使用 yarn 框架

（5）配置 yarn-site.xml

官方提供了默认的 yarn-default.xml 配置文件 可供参考，再结合 ResourceManager HA 的官方介绍，配置如下

<configuration>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
    <name>yarn.resourcemanager.ha.enabled</name>
    <value>true</value>
  </property>
  <property>
    <name>yarn.resourcemanager.cluster-id</name>
    <value>hdcluster</value>
  </property>
  <property>
    <name>yarn.resourcemanager.ha.rm-ids</name>
    <value>rm1,rm2</value>
  </property>
  <property>
    <name>yarn.resourcemanager.hostname.rm1</name>
    <value>hd3</value>
  </property>
  <property>
    <name>yarn.resourcemanager.hostname.rm2</name>
    <value>hd4</value>
  </property>
  <property>
    <name>yarn.resourcemanager.webapp.address.rm1</name>
    <value>hd3:8088</value>
  </property>
  <property>
    <name>yarn.resourcemanager.webapp.address.rm2</name>
    <value>hd4:8088</value>
  </property>
  <property>
    <name>yarn.resourcemanager.zk-address</name>
    <value>hd1:2181,hd2:2181,hd3:2181</value>
  </property>
</configuration>

其中，

yarn.nodemanager.aux-services：NodeManager 上运行的附属服务，需配置成 mapreduce_shuffle，才可运行 MapReduce 程序，否则会报错

yarn.resourcemanager.ha.enabled：表示启动 resourcemanager HA 高可用

yarn.resourcemanager.cluster-id：表示 resourcemanager 的集群 ID，不要与别的集群混淆即可，这里命名为 hdcluster

yarn.resourcemanager.ha.rm-ids：表示 resourcemanager 的节点 id，这里有两个节点，使用 rm1，rm2 作为 ID

yarn.resourcemanager.hostname.rm1，yarn.resourcemanager.hostname.rm2：表示 rm1，rm2 的主机，这里取 hd3、hd4

yarn.resourcemanager.webapp.address.rm1，yarn.resourcemanager.webapp.address.rm2：表示 rm1，rm2 的网页访问地址和端口，也即通过该地址和端口可访问作业情况

yarn.resourcemanager.zk-address：表示使用 zookeeper 来协助管理 resourcemanager 主备的 zookeeper 集群主机与端口

（6）配置 slave 节点主机

配置 hadoop 分布式集群的 slaves 节点主机列表，也即 datanode 运行的节点，这里取 hd2、hd3、hd4

vi /home/ahadoop/hadoop-2.8.0/etc/hadoop/slaves

# 配置 slave 主机
hd2
hd3
hd4

（7）配置 log4j 日志 log4j.properties

根据需要修改 log4j 的日志保存路径，以及日志输出的粒度

vi /home/ahadoop/hadoop-2.8.0/etc/hadoop/log4j.properties

# 修改日志的路径
hadoop.log.dir=/home/ahadoop/hadoop-data/log

（8）配置 bash 的环境变量

编辑.bash_profile 文件，配置环境变量，方便日常执行命令

vi /home/ahadoop/.bash_profile

# 在 .bash_profile 末尾增加以下配置
export JAVA_HOME=/usr/java/jdk1.8.0_131
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

export HADOOP_HOME=/home/ahadoop/hadoop-2.8.0
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export ZOOKEEPER_HOME=/home/ahadoop/zookeeper-3.4.10
export PATH=$PATH:$ZOOKEEPER_HOME/bin

配置后，使用 source 命令使其生效

source /home/ahadoop/.bash_profile

8、格式 hadoop namenode，并启动 hadoop 分布式集群

通过以上的配置文件，已完成了 hadoop 集群的配置。在首次运行 hadoop 集群时，须先进行 namenode 的格式化，然后再启动整个集群。

注意：只有第一次运行，才需要格式化 namenode 哦，以后就不用了，否则一格式化将会清空整个集群的元数据和数据块

hadoop 的 sbin 目录里面提供了便捷的启动脚本

最简单的有 start-all.sh、stop-all.sh 脚本，可直接启动 / 终止整个 hadoop 集群，使用这两个命令，必须实现集群节点 ssh 免密码登录，如在 hd1 主机执行这些命令，则须实现 hd1 免密码登录到 hd2、hd3、hd4。在生产环境中，不推荐使用 start-all.sh、stop-all.sh 来维护整个集群，可能启动 / 终止过程会出现什么问题，影响到整个集群。在个人测试环节，则请便，怎么 6、怎么来。
另外，还提供了 start-dfs.sh、stop-dfs.sh 来启动 / 终止 hdfs，start-yarn.sh、stop-yarn.sh 来启动 / 终止 yarn，同样需要实现集群节点的 ssh 免密码登录，在生产环境，也不推荐使用这种方式。在个人测试环节，则请便，怎么 6、怎么来。
第三，还提供了 hadoop-daemon.sh，yarn-daemon.sh 来启动 / 终止 hdfs、yarn，使用方法如下，当执行 hadoop-daemon.sh start namenode，则是启动 namenode（secondaryname、datanode、journalnode 等类似），使用 stop 则是终止；当执行 yarn-daemon.sh start resourcemanager，则是启动 resourcemanager（nodemanager 类似），使用 stop 则是终止。使用这种启动方式，需要各个节点，逐一启动相应的进程，无须实现 ssh 免密码登录。这种方式的好处在于，某个节点的进程启动 / 终止，如果有问题，不会影响到整个集群，但管理员必须对整个集群的节点功能分布非常清楚。
第四，hadoop 新版本还提供了 hdfs、yarn 的进程启动 / 终止方式（位于 hadoop 的 bin 目录），使用方法如下，hdfs namenode，则是启动 namenode（secondaryname、datanode、journalnode 等类似），那如果要终止呢？？？kill 吧，kill 相应的进程会自动调用终止程序；yarn resourcemanager，则是启动 resourcemanager（nodemanager 类似），如果要终止，同样 kill 就好。使用这种方式，对于初学者来说，可以更好的搞清楚整个集群节点的启动顺序。

在本测试中，便是使用 hdfs、yarn 来启动节点

首次使用 hadoop 分布式集群时，需要格式化 namenode，并同步 ha 状态到 zookeeper，启动的顺序如下：

# 首次格式化启动顺序

# 启动 zookeeper（hd1，hd2，hd3）
zkServer.sh start &

# 启动 journalnode（hd1，hd2，hd3）
hdfs journalnode &

# 格式化 namenode（hd1）
hdfs namenode -format

# 初始化 HA 状态到 zk（hd1）
hdfs zkfc -formatZK &

# 启动 namenode active（hd1）
hdfs namenode &

# 同步 namenode（hd2）
hdfs namenode -bootstrapStandby

# 启动 namenode standby（hd2）
hdfs namenode &

# 启动 ZookeeperFailoverController（hd1，hd2）
hdfs zkfc &

# 启动 datanode（hd2，hd3，hd4）
hdfs datanode &

# 启动 resourcemanager（hd3，hd4）
yarn resourcemanager &

# 启动 nodemanager（hd2，hd3，hd4）
yarn nodemanager &

启动后，使用 jps 在各个节点，查看进程的启动情况

# hd1
[ahadoop@31d48048cb1e ~]$ jps
8976 NameNode
8803 JournalNode
9172 Jps
9092 DFSZKFailoverController
8750 QuorumPeerMain

# hd2
[ahadoop@1620d6ed305d ~]$ jps
7428 QuorumPeerMain
7636 NameNode
8021 Jps
7719 DFSZKFailoverController
7784 DataNode
7884 NodeManager
7487 JournalNode

# hd3
[ahadoop@ed3702f8924e ~]$ jps
4320 QuorumPeerMain
4451 DataNode
4900 Jps
4772 NodeManager
4373 JournalNode
4540 ResourceManager

# hd4
[ahadoop@ee8319514df6 ~]$ jps
4578 NodeManager
4707 Jps
4489 DataNode
4508 ResourceManager

至今，整个集群就成功启动了

如果以后使用时，就不用再格式化 namenode 了（否则数据会完蛋），那么正常情况下，集群启动的顺序为

# 日常使用的启动顺序

# 启动 zookeeper（hd1，hd2，hd3）
zkServer.sh start &

# 启动 journalnode（hd1，hd2，hd3）
hdfs journalnode &

# 启动 namenode active（hd1）
hdfs namenode &

# 启动 namenode standby（hd2）
hdfs namenode &

# 启动 ZookeeperFailoverController（hd1，hd2）
hdfs zkfc &

# 启动 datanode（hd2，hd3，hd4）
hdfs datanode &

# 启动 resourcemanager（hd3，hd4）
yarn resourcemanager &

# 启动 nodemanager（hd2，hd3，hd4）
yarn nodemanager &

9、hadoop 集群测试

集群启动后，在浏览器输入以下网址查看 namenode、resourcemanager 的状态

输入网址 http://172.17.0.1:50070 查看 namenode（active）节点信息