阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

CentOS7 或 RHEL7下搭建Hadoop 2.7.6完全分布式

440次阅读
没有评论

共计 5522 个字符,预计需要花费 14 分钟才能阅读完成。

这里搭建的是 3 个节点的完全分布式,即 1 个 nameNode,2 个 dataNode,分别如下:

CentOS-master   nameNode   192.168.11.128

CentOS-node1   dataNode    192.168.11.131

CentOS-node2   dataNode    192.168..11.132

1. 首先创建好一个 CentOS 虚拟机,将它作为主节点我这里起名为 CentOS-master,起什么都行,不固定要求

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

2.VMware 中打开虚拟机,输入 Java -version,检查是否有 JDK 环境,不要用系统自带的 openJDK 版本,要自己安装的版本

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

3. 输入 systemctl status firewalld.service,若如图,防火墙处于 running 状态,则执行第 4 和第 5 步,否则直接进入第 6 步

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

 4. 输入 systemctl stop firewalld.service,关闭防火墙

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

5. 输入 systemctl disable firewalld.service,禁用防火墙

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

6. 输入 mkdir /usr/local/Hadoop 创建一个 hadoop 的文件夹

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

7. 将 hadoop 的 tar 包放到刚创建好的目录

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

8. 进入 hadoop 目录,输入 tar -zxvf hadoop-2.7.3.tar.gz 解压 tar 包

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

9. 输入 vi /etc/profile,配置环境变量

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

10. 加入如下内容,保存并退出

HADOOP_HOME=/usr/local/hadoop/hadoop-2.7.3/

PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

11. 输入 . /etc/profile,使环境变量生效

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

12. 任意目录输入 hado,然后按 Tab,如果自动补全为 hadoop,则说明环境变量配的没问题,否则检查环境变量哪出错了

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

13. 创建 3 个之后要用到的文件夹,分别如下:

mkdir /usr/local/hadoop/tmp

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

mkdir -p /usr/local/hadoop/hdfs/name

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

mkdir /usr/local/hadoop/hdfs/data

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

14. 进入 hadoop 解压后的 /etc/hadoop 目录,里面存放的是 hadoop 的配置文件,接下来要修改这里面一些配置文件

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

15. 有 2 个.sh 文件,需要指定一下 JAVA 的目录,首先输入 vi hadoop-env.sh 修改配置文件

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

16. 将原有的 JAVA_HOME 注释掉,根据自己的 JDK 安装位置,精确配置 JAVA_HOME 如下,保存并退出

export JAVA_HOME=/usr/local/java/jdk1.8.0_102/

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

17. 输入 vi yarn-env.sh 修改配置文件

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

18. 加入如下内容,指定 JAVA_HOME,保存并退出

export JAVA_HOME=/usr/local/java/jdk1.8.0_102

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

19. 输入 vi core-site.xml 修改配置文件

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

20. 在 configuration 标签中,添加如下内容,保存并退出,注意这里配置的 hdfs:master:9000 是不能在浏览器访问的

<property>

<name> fs.default.name </name>

<value>hdfs://master:9000</value>

<description> 指定 HDFS 的默认名称 </description>

</property>

<property>

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

<description>HDFS 的 URI</description>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/tmp</value>

<description> 节点上本地的 hadoop 临时文件夹 </description>

</property>

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

21. 输入 vi hdfs-site.xml 修改配置文件

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

22. 在 configuration 标签中,添加如下内容,保存并退出

<property>

        <name>dfs.namenode.name.dir</name>

        <value>file:/usr/local/hadoop/hdfs/name</value>

<description>namenode 上存储 hdfs 名字空间元数据 </description>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>file:/usr/local/hadoop/hdfs/data</value>

<description>datanode 上数据块的物理存储位置 </description>

    </property>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

<description> 副本个数,默认是 3, 应小于 datanode 机器数量 </description>

    </property>

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

23. 输入 cp mapred-site.xml.template mapred-site.xml 将 mapred-site.xml.template 文件复制到当前目录,并重命名为 mapred-site.xml

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

24. 输入 vi mapred-site.xml 修改配置文件

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

25. 在 configuration 标签中,添加如下内容,保存并退出

<property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

<description> 指定 mapreduce 使用 yarn 框架 </description>

</property>

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

26. 输入 vi yarn-site.xml 修改配置文件

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

27. 在 configuration 标签中,添加如下内容,保存并退出

<property>

        <name>yarn.resourcemanager.hostname</name>

        <value>master</value>

<description>指定resourcemanager 所在的 hostname</description>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

<description>

NodeManager 上运行的附属服务。

需配置成mapreduce_shuffle,才可运行 MapReduce 程序

</description>

</property>

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

28. 输入 vi slaves 修改配置文件

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

29. 将 localhost 删掉,加入如下内容,即 dataNode 节点的主机名

node1

node2

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

30. 将虚拟机关闭,再复制两份虚拟机,重命名为如下,注意这里一定要关闭虚拟机,再复制

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

31. 将 3 台虚拟机都打开,后两台复制的虚拟机打开时,都选择“我已复制该虚拟机”

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

32. 在 master 机器上,输入 vi /etc/hostname,将 localhost 改为 master,保存并退出

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

33. 在 node1 机器上,输入 vi /etc/hostname,将 localhost 改为 node1,保存并退出

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

34. 在 node2 机器上,输入 vi /etc/hostname,将 localhost 改为 node2,保存并退出

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

35. 在三台机器分别输入 vi /etc/hosts 修改文件,其作用是将一些常用的网址域名与其对应的 IP 地址建立一个关联,当用户在访问网址时,系统会首先自动从 Hosts 文件中寻找对应的 IP 地址

36. 三个文件中都加入如下内容,保存并退出,注意这里要根据自己实际 IP 和节点主机名进行更改,IP 和主机名中间要有一个空格

192.168.11.128 master

192.168.11.131 node1

192.168.11.132 node2

37. 在 master 机器上输入 ssh-keygen -t dsa -P ” -f ~/.ssh/id_dsa 创建一个无密码的公钥,- t 是类型的意思,dsa 是生成的密钥类型,- P 是密码,’’表示无密码,- f 后是秘钥生成后保存的位置

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

38. 在 master 机器上输入 cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys 将公钥 id_dsa.pub 添加进 keys,这样就可以实现无密登陆 ssh

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

39. 在 master 机器上输入 ssh master 测试免密码登陆

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

如果有询问,则输入 yes,回车

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

40. 在 node1 主机上执行 mkdir ~/.ssh

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

41. 在 node2 主机上执行 mkdir ~/.ssh

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

42. 在 master 机器上输入 scp ~/.ssh/authorized_keys root@node1:~/.ssh/authorized_keys 将主节点的公钥信息导入 node1 节点,导入时要输入一下 node1 机器的登陆密码

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

43. 在 master 机器上输入 scp ~/.ssh/authorized_keys root@node2:~/.ssh/authorized_keys 将主节点的公钥信息导入 node2 节点,导入时要输入一下 node2 机器的登陆密码

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

44. 在三台机器上分别执行 chmod 600 ~/.ssh/authorized_keys 赋予密钥文件权限

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

45. 在 master 节点上分别输入 ssh node1 和 ssh node2 测试是否配置 ssh 成功

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

46.如果 node 节点还没有 hadoop,master 机器上分别输入如下命令将 hadoop 复制

scp -r /usr/local/hadoop/ root@node1:/usr/local/

scp -r /usr/local/hadoop/ root@node2:/usr/local/

47. 在 master 机器上,任意目录输入 hdfs namenode -format 格式化 namenode,第一次使用需格式化一次,之后就不用再格式化,如果改一些配置文件了,可能还需要再次格式化

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

48. 格式化完成

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

49. 在 master 机器上,进入 hadoop 的 sbin 目录,输入 ./start-all.sh 启动 hadoop

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

50. 输入 yes,回车

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

51. 输入 jps 查看当前 java 的进程,该命令是 JDK1.5 开始有的,作用是列出当前 java 进程的 PID 和 Java 主类名,nameNode 节点除了 JPS,还有 3 个进程,启动成功

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

52. 在 node1 机器和 node2 机器上分别输入 jps 查看进程如下,说明配置成功

 CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

53. 在浏览器访问 nameNode 节点的 8088 端口和 50070 端口可以查看 hadoop 的运行状况

CentOS7 或 RHEL7 下搭建 Hadoop 2.7.6 完全分布式

54. 在 master 机器上,进入 hadoop 的 sbin 目录,输入 ./stop-all.sh 关闭 hadoop

Hadoop2.3-HA 高可用集群环境搭建  https://www.linuxidc.com/Linux/2017-03/142155.htm
Hadoop 项目之基于 CentOS7 的 Cloudera 5.10.1(CDH)的安装部署  https://www.linuxidc.com/Linux/2017-04/143095.htm
CentOS 7.4 下 Hadoop 2.7.6 安装部署 https://www.linuxidc.com/Linux/2018-08/153353.htm
Hadoop2.7.2 集群搭建详解(高可用)https://www.linuxidc.com/Linux/2017-03/142052.htm
使用 Ambari 来部署 Hadoop 集群(搭建内网 HDP 源)https://www.linuxidc.com/Linux/2017-03/142136.htm
Ubuntu 14.04 下 Hadoop 集群安装  https://www.linuxidc.com/Linux/2017-02/140783.htm
CentOS 6.7 安装 Hadoop 2.7.2  https://www.linuxidc.com/Linux/2017-08/146232.htm
Ubuntu 16.04 上构建分布式 Hadoop-2.7.3 集群  https://www.linuxidc.com/Linux/2017-07/145503.htm
CentOS 7 下 Hadoop 2.6.4 分布式集群环境搭建  https://www.linuxidc.com/Linux/2017-06/144932.htm
Hadoop2.7.3+Spark2.1.0 完全分布式集群搭建过程  https://www.linuxidc.com/Linux/2017-06/144926.htm
CentOS 7.4 下编译安装 Hadoop 2.7.6 及所需文件  https://www.linuxidc.com/Linux/2018-06/152786.htm
Ubuntu 16.04.3 下安装配置 Hadoop https://www.linuxidc.com/Linux/2018-04/151993.htm

更多 Hadoop 相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-21发表,共计5522字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

星哥玩云

星哥玩云
星哥玩云
分享互联网知识
用户数
4
文章数
19351
评论数
4
阅读量
7984787
文章搜索
热门文章
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
我把用了20年的360安全卫士卸载了

我把用了20年的360安全卫士卸载了

我把用了 20 年的 360 安全卫士卸载了 是的,正如标题你看到的。 原因 偷摸安装自家的软件 莫名其妙安装...
再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见 zabbix!轻量级自建服务器监控神器在 Linux 的完整部署指南 在日常运维中,服务器监控是绕不开的...
飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛 NAS 中安装 Navidrome 音乐文件中文标签乱码问题解决、安装 FntermX 终端 问题背景 ...
阿里云CDN
阿里云CDN-提高用户访问的响应速度和成功率
随机文章
我用AI做了一个1978年至2019年中国大陆企业注册的查询网站

我用AI做了一个1978年至2019年中国大陆企业注册的查询网站

我用 AI 做了一个 1978 年至 2019 年中国大陆企业注册的查询网站 最近星哥在 GitHub 上偶然...
【开源神器】微信公众号内容单篇、批量下载软件

【开源神器】微信公众号内容单篇、批量下载软件

【开源神器】微信公众号内容单篇、批量下载软件 大家好,我是星哥,很多人都希望能高效地保存微信公众号的文章,用于...
星哥带你玩飞牛 NAS-10:备份微信聊天记录、数据到你的NAS中!

星哥带你玩飞牛 NAS-10:备份微信聊天记录、数据到你的NAS中!

星哥带你玩飞牛 NAS-10:备份微信聊天记录、数据到你的 NAS 中! 大家对「数据安全感」的需求越来越高 ...
免费无广告!这款跨平台AI RSS阅读器,拯救你的信息焦虑

免费无广告!这款跨平台AI RSS阅读器,拯救你的信息焦虑

  免费无广告!这款跨平台 AI RSS 阅读器,拯救你的信息焦虑 在算法推荐主导信息流的时代,我们...
星哥带你玩飞牛NAS-1:安装飞牛NAS

星哥带你玩飞牛NAS-1:安装飞牛NAS

星哥带你玩飞牛 NAS-1:安装飞牛 NAS 前言 在家庭和小型工作室场景中,NAS(Network Atta...

免费图片视频管理工具让灵感库告别混乱

一言一句话
-「
手气不错
恶意团伙利用 PHP-FPM 未授权访问漏洞发起大规模攻击

恶意团伙利用 PHP-FPM 未授权访问漏洞发起大规模攻击

恶意团伙利用 PHP-FPM 未授权访问漏洞发起大规模攻击 PHP-FPM(FastCGl Process M...
星哥带你玩飞牛NAS硬件02:某鱼6张左右就可拿下5盘位的飞牛圣体NAS

星哥带你玩飞牛NAS硬件02:某鱼6张左右就可拿下5盘位的飞牛圣体NAS

星哥带你玩飞牛 NAS 硬件 02:某鱼 6 张左右就可拿下 5 盘位的飞牛圣体 NAS 前言 大家好,我是星...
国产开源公众号AI知识库 Agent:突破未认证号限制,一键搞定自动回复,重构运营效率

国产开源公众号AI知识库 Agent:突破未认证号限制,一键搞定自动回复,重构运营效率

国产开源公众号 AI 知识库 Agent:突破未认证号限制,一键搞定自动回复,重构运营效率 大家好,我是星哥,...
还在找免费服务器?无广告免费主机,新手也能轻松上手!

还在找免费服务器?无广告免费主机,新手也能轻松上手!

还在找免费服务器?无广告免费主机,新手也能轻松上手! 前言 对于个人开发者、建站新手或是想搭建测试站点的从业者...
星哥带你玩飞牛 NAS-10:备份微信聊天记录、数据到你的NAS中!

星哥带你玩飞牛 NAS-10:备份微信聊天记录、数据到你的NAS中!

星哥带你玩飞牛 NAS-10:备份微信聊天记录、数据到你的 NAS 中! 大家对「数据安全感」的需求越来越高 ...