阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

使用Windows Azure的VM安装和配置CDH搭建Hadoop集群

465次阅读
没有评论

共计 3046 个字符,预计需要花费 8 分钟才能阅读完成。

本文主要内容是使用 Windows Azure 的 VIRTUAL MACHINES 和 NETWORKS 服务安装 CDH (Cloudera Distribution Including Apache Hadoop)搭建 Hadoop 集群。

项目中在私有云中使用 CDH (Cloudera Distribution Including Apache Hadoop)搭建 Hadoop 集群进行大数据计算。作为微软的忠实粉丝,将 CDH 部署到 Windows Azure 的虚拟机中是我的必然选择。由于 CDH 中包含多个开源服务,所以虚拟机需要开放的端口众多。Windows Azure 中的虚拟机的网络是被安全隔离的,因此在 Windows Azure 中 Virtual machines 的服务中创建多个虚拟机安装 Hadoop cluster,最佳的方案是为 Hadoop 集群创建虚拟网络,在虚拟网络中的资源和服务就像在虚拟私有云中互相访问,而与虚拟网络之外的其他资源是隔离的,从而实现安全性。

What is CDH?

CDH is the distribution of Apache Hadoop and related projects. CDH is 100% Apache-licensed open source and is the only Hadoop solution to offer unified batch processing, interactive SQL, and interactive search, and role-based access controls.

 

在 Windows Azure 中创建虚拟网络

 

  1. 登录到 Windows Azure 管理门户 , 在左下角单击 ” 新建 ”。

使用 Windows Azure 的 VM 安装和配置 CDH 搭建 Hadoop 集群

  1. 在导航窗格中,依次单击 网络 虚拟网络 自定义创建

使用 Windows Azure 的 VM 安装和配置 CDH 搭建 Hadoop 集群

  1. 虚拟网络详细信息 屏幕上,输入虚拟网络的配置信息,然后单击 下一步 箭头。在此输入的配置信息包括虚拟网络的名称、地缘组区域和地缘组的名称。

地缘组是一种用于在同一数据中心以物理方式将 Windows Azure 服务组合起来以提高性能的方法。只能向一个虚拟网络分配地缘组。

  1. 设置 DNS Server VPN Connectivity,此步骤可不为跳过,在虚拟网络创建后需要时再设置。

 

使用 Windows Azure 的 VM 安装和配置 CDH 搭建 Hadoop 集群

 

  1. 地址空间和子网 屏幕上,输入以下信息,然后单击 下一步 箭头。地址空间必须为用 CIDR 表示法指定的专用地址范围:10.0.0.0/8172.16.0.0/12 192.168.0.0/16(由 RFC 1918 指定)。本例中选择的是 Starting IP 选择的是 192.168.0.0。

单击右下角的对号按钮,此时 Windows Azure 将根据提交的配置创建您的虚拟网络。

 

使用 Windows Azure 的 VM 安装和配置 CDH 搭建 Hadoop 集群

 

此时,您已在 Windows Azure 中拥有一个虚拟网络,可以在门户的 虚拟网络 选项卡上看到它。更多的详细配置方法可参考 Windows Azure 官方文档 Windows Azure 中创建 虚拟网

 

从 Windows Azure 映像库中创建 Linux 虚拟机

 

创建 Linux 虚拟机的步骤可参考 Windows Azure 上的文档《创建运行 Linux 的虚拟机》http://www.windowsazure.cn/zh-cn/manage/linux/tutorials/virtual-machine-from-gallery/

请注意在 ” 虚拟机配置 ” 对话框中的 ”REGION/AFFINITY GROUP/VIRTUAL NETWORK” 选项中选择上一步骤中创建的虚拟网络。在本例中选中的是作者创建的虚拟网络 ”hadoopclusternetwork”。

使用 Windows Azure 的 VM 安装和配置 CDH 搭建 Hadoop 集群

 

为虚拟机开放如下的端口,即在虚拟机配置中设置如下的 Endpoints。

  • Enable port for Virtual machines
    • 7180 (Cloudera Manager web UI)
    • 8020, 50010, 50020, 50070, 50075 (HDFS NameNode and DataNode)
    • 8021 (MapReduce JobTracker)
    • 8888 (Hue web UI)
    • 9083 (Hive/HCatalog metastore)
    • 41415 (Flume agent)
    • 11000 (Oozie server)
    • 21050 (Impala JDBC port)

 

使用同样的方式创建多个虚拟机组成可按照 Hadoop 的集群,请注意多个虚拟机使用同一个虚拟网络。

安装 CDH

 

配置各个主机的 HOSTNAME

vi /etc/sysconfig/network

修改其中的 HOSTNAME

配置各个主机上的/etc/hosts

vi /etc/hosts

使用 Windows Azure 的 VM 安装和配置 CDH 搭建 Hadoop 集群

修改 HOSTNAME 和 hosts 后,建议重启。

关闭防火墙

root 下执行下面命令,可以临时关闭防火墙

service iptables stop

root 下执行下面命令,可以永久关闭防火墙(即,每次开机都会关闭),但需要重启生效

chkconfig iptables off

 

关闭SELinux

$ setenforce 0

如果需要永久关闭,编辑/etc/selinux/config ,设置SELINUX=disabled
,然后完成安装。

 

更改 Cloudera-manager-installer.bin 权限

$ chmod u+x cloudera-manager-installer.bin

$ ./cloudera-manager-installer.bin

接着,接受许可协议,按 EnterNext

安装界面如下所示:

使用 Windows Azure 的 VM 安装和配置 CDH 搭建 Hadoop 集群

 

启动 Cloudera Manager Admin 控制台

 通过 Cloudera Manager Admin 控制台,可以配置、管理、监控集群上的 HadoopWEB 端的 URL 地址是:http://myhost.example.com:7180myhost.example.com是你安装 Cloudera-Manager-installer.bin 的主机域名,当然用 IP 也是可以的。例如我的 WEBURL地址就是:http://hcc1.cloudapp.net:7180 。按照提示安装即可,安装成功的界面如下图所示。

使用 Windows Azure 的 VM 安装和配置 CDH 搭建 Hadoop 集群 

CentOS 安装和配置 Hadoop2.2.0  http://www.linuxidc.com/Linux/2014-01/94685.htm

Ubuntu 13.04 上搭建 Hadoop 环境 http://www.linuxidc.com/Linux/2013-06/86106.htm

Ubuntu 12.10 +Hadoop 1.2.1 版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm

Ubuntu 上搭建 Hadoop 环境(单机模式 + 伪分布模式)http://www.linuxidc.com/Linux/2013-01/77681.htm

Ubuntu 下 Hadoop 环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm

单机版搭建 Hadoop 环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm

搭建 Hadoop 环境(在 Winodws 环境下用虚拟机虚拟两个 Ubuntu 系统进行搭建)http://www.linuxidc.com/Linux/2011-12/48894.htm

更多 Hadoop 相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-20发表,共计3046字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

星哥玩云

星哥玩云
星哥玩云
分享互联网知识
用户数
4
文章数
19351
评论数
4
阅读量
7973880
文章搜索
热门文章
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
我把用了20年的360安全卫士卸载了

我把用了20年的360安全卫士卸载了

我把用了 20 年的 360 安全卫士卸载了 是的,正如标题你看到的。 原因 偷摸安装自家的软件 莫名其妙安装...
再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见 zabbix!轻量级自建服务器监控神器在 Linux 的完整部署指南 在日常运维中,服务器监控是绕不开的...
飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛 NAS 中安装 Navidrome 音乐文件中文标签乱码问题解决、安装 FntermX 终端 问题背景 ...
阿里云CDN
阿里云CDN-提高用户访问的响应速度和成功率
随机文章
星哥带你玩飞牛NAS硬件02:某鱼6张左右就可拿下5盘位的飞牛圣体NAS

星哥带你玩飞牛NAS硬件02:某鱼6张左右就可拿下5盘位的飞牛圣体NAS

星哥带你玩飞牛 NAS 硬件 02:某鱼 6 张左右就可拿下 5 盘位的飞牛圣体 NAS 前言 大家好,我是星...
飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛 NAS 中安装 Navidrome 音乐文件中文标签乱码问题解决、安装 FntermX 终端 问题背景 ...
免费领取huggingface的2核16G云服务器,超简单教程

免费领取huggingface的2核16G云服务器,超简单教程

免费领取 huggingface 的 2 核 16G 云服务器,超简单教程 前言 HuggingFace.co...
支付宝、淘宝、闲鱼又双叕崩了,Cloudflare也瘫了连监控都挂,根因藏在哪?

支付宝、淘宝、闲鱼又双叕崩了,Cloudflare也瘫了连监控都挂,根因藏在哪?

支付宝、淘宝、闲鱼又双叕崩了,Cloudflare 也瘫了连监控都挂,根因藏在哪? 最近两天的互联网堪称“故障...
星哥带你玩飞牛NAS-5:飞牛NAS中的Docker功能介绍

星哥带你玩飞牛NAS-5:飞牛NAS中的Docker功能介绍

星哥带你玩飞牛 NAS-5:飞牛 NAS 中的 Docker 功能介绍 大家好,我是星哥,今天给大家带来如何在...

免费图片视频管理工具让灵感库告别混乱

一言一句话
-「
手气不错
浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍

浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍

浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍 前言 在 AI 自动化快速发展的当下,浏览器早已不再只是...
如何安装2026年最强个人助理ClawdBot、完整安装教程

如何安装2026年最强个人助理ClawdBot、完整安装教程

如何安装 2026 年最强个人助理 ClawdBot、完整安装教程 一、前言 学不完,根本学不完!近期,一款名...
你的云服务器到底有多强?宝塔跑分告诉你

你的云服务器到底有多强?宝塔跑分告诉你

你的云服务器到底有多强?宝塔跑分告诉你 为什么要用宝塔跑分? 宝塔跑分其实就是对 CPU、内存、磁盘、IO 做...
星哥带你玩飞牛NAS-11:咪咕视频订阅部署全攻略

星哥带你玩飞牛NAS-11:咪咕视频订阅部署全攻略

星哥带你玩飞牛 NAS-11:咪咕视频订阅部署全攻略 前言 在家庭影音系统里,NAS 不仅是存储中心,更是内容...
仅2MB大小!开源硬件监控工具:Win11 无缝适配,CPU、GPU、网速全维度掌控

仅2MB大小!开源硬件监控工具:Win11 无缝适配,CPU、GPU、网速全维度掌控

还在忍受动辄数百兆的“全家桶”监控软件?后台偷占资源、界面杂乱冗余,想查个 CPU 温度都要层层点选? 今天给...