64位CentOS下Hadoop2.2.0集群安装

189次阅读

没有评论

共计 6503 个字符，预计需要花费 17 分钟才能阅读完成。

1、准备环境

三台 64 位 CentOS，安装在 VMware 虚拟机下。

1）安装中文输入法：

1、需要 root 权限，所以要用 root 登录，或 su root

2、yum install “@Chinese Support”

2）安装 ssh 或者 vsftp

使用 chkconfig –list 来查看是否装有 vsftpd 服务；

使用 yum 命令直接安装：yum install vsftpd

查看与管理 ftp 服务：

启动 ftp 服务：service vsftpd start

查看 ftp 服务状态：service vsftpd status

重启 ftp 服务：service vsftpd restart

关闭 ftp 服务：service vsftpd stop

3)jdk 安装

参考 http://www.linuxidc.com/Linux/2014-06/102663.htm

————————————– 分割线 ————————————–

Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm

Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm

Ubuntu 上搭建 Hadoop 环境（单机模式 + 伪分布模式）http://www.linuxidc.com/Linux/2013-01/77681.htm

Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm

单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm

Hadoop LZO 安装教程 http://www.linuxidc.com/Linux/2013-01/78397.htm

Hadoop 集群上使用 Lzo 压缩 http://www.linuxidc.com/Linux/2012-05/60554.htm

————————————– 分割线 ————————————–

2、修改主机名

本人安装一个虚拟机，然后通过虚拟机 -》管理 -》克隆完成其他两台机器的安装，现在存在的一个问题就是主机名是一样的，这个明显不是自己想要的，所以需要修改其余两台的主机名。

[root@slaver2 sysconfig]# vi /etc/sysconfig/network

NETWORKING=yes

HOSTNAME=slaver

3、配置 /ect/hosts，三台服务器的配置一样

vi /etc/hosts

192.168.21.128 master

192.168.21.131 slaver

192.168.21.130 slaver2

4、创建用户（使用 root 用户创建后来发现 Browse the filesystem 报错，后来查文档，建议使用新建的用户）

useradd hadoop

passwd hadoop

输入密码，确认

5、ssh 无密码登录

参考：http://www.linuxidc.com/Linux/2014-06/102664.htm

6、HADOOP 的下载和环境的配置

http://mirror.esocc.com/apache/hadoop/common/hadoop-2.2.0/

[] hadoop-2.2.0.tar.gz 07-Oct-2013 14:46 104M

hadoop 环境变量的配置：

vi/etc/profile

在文件的最下面添加

export HADOOP_HOME=/usr/zkt/hadoop2.2.0/hadoop-2.2.0

export PAHT=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export HADOOP_LOG_DIR=/usr/zkt/hadoop2.2.0/hadoop-2.2.0/logs

export YARN_LOG_DIR=$HADOOP_LOG_DIR

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

export HADOOP_OPTS=”-Djava.library.path=$HADOOP_HOME/lib”

注：在 64 位操作系统上需要加入一下红色部分的配置信息

注：/usr/zkt/hadoop2.2.0/hadoop-2.2.0 为自定义的下载 hadoop 文件的解压路径

更多详情见请继续阅读下一页的精彩内容 ：http://www.linuxidc.com/Linux/2014-06/102662p2.htm

7、修改 Hadoop 的配置文件 hadoop2.2.0/etc/hadoop

1、修改 hadoop-env.sh 确保 hadoop 运行所需要的 java 环境

# The java implementation to use.

export JAVA_HOME=/usr/java/jdk1.7.0_55

2、修改 core-site.xml 文件定义文件系统的配置

<name>fs.default.name</name>

<value>hdfs://master:9000/</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/zkt/hadoop2.2.0/tmp</value>

</property>

</configuration>

3、修改 hadfs-site.xml 定义名称节点和数据节点

<name>dfs.datanode.data.dir</name>

<value>/usr/zkt/hadoop2.2.0/data</value>

</property>

<name>dfs.namenode.name.dir</name>

<value>/usr/zkt/hadoop2.2.0/hdf/name</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

4、修改 mapred-site.xml Configurations for MapReduce Applications

<name>mapred.job.tracker</name>

<value>master:9001</value>

</property>

5、修改 yarn-site.xml 文件

该文件主要用于：

1、Configurations for ResourceManager and NodeManager:

2、Configurations for ResourceManager:

3、Configurations for NodeManager:

4、Configurations for History Server (Needs to be moved elsewhere):

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master:8025</value>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master:8030</value>

</property>

<name>yarn.resourcemanager.address</name>

<value>master:8040</value>

</property>

8、创建第 7 步配置文件中多出的文件夹

data tmp name log mkdir -r /usr/zkt/hadoop2.2.0/data 等

9、为这些文件夹赋权限比较关键不然文件生成的时候无文件创建、写权限

su – root

chown -R hadoop:hadoop /usr/zkt/hadoop2.2.0 (不明白的可以查看 chown 命令)

10、将配置好的 hadoop 分别拷贝到 slaver 和 slaver2 主机上

scp -r /usr/zkt/hadoop2.2.0/hadoop-2.2.0 hadoop@slaver:/usr/zkt/hadoop2.2.0/

scp -r /usr/zkt/hadoop2.2.0/hadoop-2.2.0 hadoop@slaver2:/usr/zkt/hadoop2.2.0/

11、hadoop namenode 的初始化

如果 hadoop 环境变量配置没问题直接使用

hdfs namenode -format

hadoop command not found 解决办法：

echo $PATH

发现 hadoop 的环境变量是：/home/hadoop/bin 而不是我们配置的环境变量，我们需要把 hadoop-2.2.0 包下的 bin、sbin 文件夹拷贝到 /home/hadoop/ 下，再次 echo $PATH，发现可以了。

12、启动 hadoop

start-all.sh

关闭 hadoop

stop-all.sh

13、查看启动的节点进程

jps

14、通过页面请求查看

http://master:50070

更多 Hadoop 相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

1、准备环境

三台 64 位 CentOS，安装在 VMware 虚拟机下。

1）安装中文输入法：

1、需要 root 权限，所以要用 root 登录，或 su root

2、yum install “@Chinese Support”

2）安装 ssh 或者 vsftp

使用 chkconfig –list 来查看是否装有 vsftpd 服务；

使用 yum 命令直接安装：yum install vsftpd

查看与管理 ftp 服务：

启动 ftp 服务：service vsftpd start

查看 ftp 服务状态：service vsftpd status

重启 ftp 服务：service vsftpd restart

关闭 ftp 服务：service vsftpd stop

3)jdk 安装

参考 http://www.linuxidc.com/Linux/2014-06/102663.htm

————————————– 分割线 ————————————–

Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm

Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm

Ubuntu 上搭建 Hadoop 环境（单机模式 + 伪分布模式）http://www.linuxidc.com/Linux/2013-01/77681.htm

Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm

单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm

Hadoop LZO 安装教程 http://www.linuxidc.com/Linux/2013-01/78397.htm

Hadoop 集群上使用 Lzo 压缩 http://www.linuxidc.com/Linux/2012-05/60554.htm

————————————– 分割线 ————————————–

2、修改主机名

本人安装一个虚拟机，然后通过虚拟机 -》管理 -》克隆完成其他两台机器的安装，现在存在的一个问题就是主机名是一样的，这个明显不是自己想要的，所以需要修改其余两台的主机名。

[root@slaver2 sysconfig]# vi /etc/sysconfig/network

NETWORKING=yes

HOSTNAME=slaver

3、配置 /ect/hosts，三台服务器的配置一样

vi /etc/hosts

192.168.21.128 master

192.168.21.131 slaver

192.168.21.130 slaver2

4、创建用户（使用 root 用户创建后来发现 Browse the filesystem 报错，后来查文档，建议使用新建的用户）

useradd hadoop

passwd hadoop

输入密码，确认

5、ssh 无密码登录

参考：http://www.linuxidc.com/Linux/2014-06/102664.htm

6、HADOOP 的下载和环境的配置

http://mirror.esocc.com/apache/hadoop/common/hadoop-2.2.0/

[] hadoop-2.2.0.tar.gz 07-Oct-2013 14:46 104M

hadoop 环境变量的配置：

vi/etc/profile

在文件的最下面添加

export HADOOP_HOME=/usr/zkt/hadoop2.2.0/hadoop-2.2.0

export PAHT=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export HADOOP_LOG_DIR=/usr/zkt/hadoop2.2.0/hadoop-2.2.0/logs

export YARN_LOG_DIR=$HADOOP_LOG_DIR

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

export HADOOP_OPTS=”-Djava.library.path=$HADOOP_HOME/lib”

注：在 64 位操作系统上需要加入一下红色部分的配置信息

注：/usr/zkt/hadoop2.2.0/hadoop-2.2.0 为自定义的下载 hadoop 文件的解压路径

更多详情见请继续阅读下一页的精彩内容 ：http://www.linuxidc.com/Linux/2014-06/102662p2.htm

正文完

星哥说事-微信公众号

发表至：服务器应用

2022-01-20

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

安装 log.io 实时监控 php_error 日志

Apache2.40+OpenSSL1.0.1i 编译错误

Nginx学习 – ip_hash的hash算法

Nagios监控系统安装及配置

Elasticsearch 零基础到入门新手教程

Hadoop集群安装-CDH5（3台服务器集群）

Lighttpd 对视频文件压缩文件做防盗链

RedHat Linux下Web服务器的搭建

CentOS 6.5集群安装64位Hadoop2.2.0

64位CentOS下Hadoop2.2.0集群安装

免费体验GPT-4：3种白嫖大模型的方法

本机部署大语言模型：Ollama和OpenWebUI实现各大模型的人工智能自由

用香橙派AIpro部署大模型、安装宝塔搭建私有随身WEB开发环境

Ubuntu系统下部署大语言模型：Ollama和OpenWebUI实现各大模型的人工智能自由

已备案网站变更并且不影响现有业务的方案

简单介绍Nginx tp3.2.3 404问题解决方案

MySQLDump的备份方法

Linux中利用NFS实现飞鸽传书

CentOS 6.8 实战部署JStorm集群

Ubuntu 升级内核到最新版本