阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

CentOS分布式环境安装HBase-0.96.0

105次阅读
没有评论

共计 7138 个字符,预计需要花费 18 分钟才能阅读完成。

一、安装 zookeeper
在安装好分布式 Hadoop 的环境下,继续安装 zookeeper-3.4.5。
  1. $ wget http://124.202.164.9/download/32878722/41763290/4/gz/165/152/1353566847397_152/zookeeper-3.4.5.tar.gz
  2. $ tar -xf zookeeper-3.4.5.tar.gz
  3. $ cp zookeeper-3.4.5/conf/zoo_sample.cfg zookeeper-3.4.5/conf/zoo.cfg
修改 zookeeper 配置文件:
  1. $ vim zookeeper-3.4.5/conf/zoo.cfg
做如下修改:
  1. tickTime=2000
  2. dataDir=/home/ruifeng.shan/zookeeper
  3. clientPort=2181
  4. initLimit=5
  5. syncLimit=2
  6. server.1=master:2888:3888
  7. server.2=node:2888:3888
  8. server.3=slave:2888:3888
在你指定的 dataDir 目录下新建一个文件 myid,在里面添加你指定的 server 编号。例如,你为 hostname 名为 master 的指定了如下配置
server.1=master:2888:3888,所以它的编号应该是 1.
将 zookeeper-3.4.5 分发到其他机器。然后修改对应的 myid 文件内容为之前给其指定的编号。如 node 为 2,slave 为 3.
分别启动 zookeeper 服务。在每台机器上切换到 zookeeper-3.4.5 目录,执行
$bin/zkServer.sh start
就可以启动 zookeeper 服务。
二、安装 hbase-0.96.0
为了和 hadoop-2.2.0 匹配,选择的 hbase 版本为 0.96.0
  1. $ wget http://mirror.bit.edu.cn/apache/hbase/hbase-0.96.0/hbase-0.96.0-hadoop2-bin.tar.gz
  2. $ tar -xf hbase-0.96.0-hadoop2-bin.tar.gz
  3. $ cd hbase-0.96.0
修改 conf 下的配置:
  1. vim conf/hbase-env.sh
修改 JAVA_HOME:
  1. # The java implementation to use. Java 1.6 required.
  2. export JAVA_HOME=/usr/lib/jvm/java/jdk1.6.0_37
修改 HBase 使用 zookeeper 的方式:
  1. # Tell HBase whether it should manage it’s own instance of Zookeeper or not.
  2. export HBASE_MANAGES_ZK=false
这个参数默认是 true。意思是是否让 hbase 单独管理 zookeeper
如果安装的机器上已经安装了 zookeeper,并且这个 zookeeper 是多个平台共用的,那么这个参数应该设置为 false
如果集群上没有安装 zookeeper,并且只有 hbase 自己使用 zookeeper,那么这个参数应该设置为 true。
修改其 conf 目录下的 hbase-site.xml 文件。内容如下:
  1. <configuration>
  2. <property>
  3. <name>hbase.rootdir</name>
  4. <value>hdfs://master:8089/hbase</value>
  5. </property>
  6. <property>
  7. <name>hbase.master</name>
  8. <value>hdfs://master:60000</value>
  9. </property>
  10. <property>
  11. <name>hbase.cluster.distributed</name>
  12. <value>true</value>
  13. </property>
  14. <property>
  15. <name>hbase.zookeeper.property.clientPort</name>
  16. <value>2181</value>
  17. </property>
  18. <property>
  19. <name>hbase.zookeeper.quorum</name>
  20. <value>master,node,slave</value>
  21. </property>
  22. <property>
  23. <name>hbase.zookeeper.property.dataDir</name>
  24. <value>/home/aaron/zookeeper</value>
  25. </property>
  26. <property>
  27. <name>hbase.client.scanner.caching</name>
  28. <value>200</value>
  29. </property>
  30. <property>
  31. <name>hbase.balancer.period</name>
  32. <value>300000</value>
  33. </property>
  34. <property>
  35. <name>hbase.client.write.buffer</name>
  36. <value>10485760</value>
  37. </property>
  38. <property>
  39. <name>hbase.hregion.majorcompaction</name>
  40. <value>7200000</value>
  41. </property>
  42. <property>
  43. <name>hbase.hregion.max.filesize</name>
  44. <value>67108864</value>
  45. <description>
  46. Maximum HStoreFile size. If any one of a column families’ HStoreFiles has
  47. grown to exceed this value, the hosting HRegion is split in two.</description>
  48. </property>
  49. <property>
  50. <name>hbase.hregion.memstore.flush.size</name>
  51. <value>1048576</value>
  52. <description>
  53. Memstore will be flushed to disk if size of the memstore
  54. exceeds this number of bytes. Value is checked by a thread that runs
  55. every hbase.server.thread.wakefrequency.</description>
  56. </property>
  57. <property>
  58. <name>hbase.server.thread.wakefrequency</name>
  59. <value>30000</value>
  60. <description>Time to sleep in between searches for work (in milliseconds).
  61. Used as sleep interval by service threads such as log roller.</description>
  62. </property>
  63. </configuration>
其中 hbase.rootdir 要保持与 hadoop 的 core-site.xml 文件中的 fs.default.name 中的值一致。
hbase 的 master 和 regionserver 的时钟要保持一致,否则启动 regionserver 的时候会报如下错误:
org.apache.hadoop.hbase.ClockOutOfSyncException: org.apache.hadoop.hbase.ClockOutOfSyncException: Server hadoop02,60020,1374576225508 has been rejected; Reported time is too far out of sync with master. Time difference of 62062623ms > max allowed of 30000ms
这是由于 master 和 regionserver 之间的时间误差太大造成的。
解决方法 1:修改下面的参数
  1. <name>hbase.master.maxclockskew</name>
  2. <value>180000</value>
  3. <description>Time difference of regionserver from master</description>
该参数默认值为 30 000(30 秒)
解决方法 2:使用 ntpdate 同步集群的时钟
修改 regionservers 文件配置:
这个文件是用来指定 regionserver 的机器的,一行一个,一般使用 datanode 作为 regionserver:
  1. $ vim conf/regionservers
master
node
slave
配置 backup-masters:
  1. $ vim conf/backup-masters
master-backup
配置 backup-masters 可以在 master 挂掉之后自动启动 backup masters
注意:为了兼容 Hadoop-2.2.0,需要将 hbase 的 lib 包中的内容 lib 包中的 hadoop-common-2.1.0-beta.jar 替换成 hadoop-2.2.0/share/hadoop/common 目录下的 hadoop-common-2.2.0.jar。
启动 hbase:
如果集群各个机器都有 ssh 无密码登陆,可以直接使用 start-hbase.sh 启动整个集群。
或者到每个机器上使用 daemon 脚本启动(切换到 hbase 目录下):
到 master 机器上:bin/hbase-daemon.sh start master
到 regionserver 机器上:bin/hbase-daemon.sh start regionserver
查看集群是否正常:
查看 master 的监控页面:
http://master:60010

HBase 的详细介绍 :请点这里
HBase 的下载地址 :请点这里

相关阅读

Hadoop+HBase 搭建云存储总结 PDF http://www.linuxidc.com/Linux/2013-05/83844.htm

HBase 结点之间时间不一致造成 regionserver 启动失败 http://www.linuxidc.com/Linux/2013-06/86655.htm

Hadoop+ZooKeeper+HBase 集群配置 http://www.linuxidc.com/Linux/2013-06/86347.htm

Hadoop 集群安装 &HBase 实验环境搭建 http://www.linuxidc.com/Linux/2013-04/83560.htm

基于 Hadoop 集群的 HBase 集群的配置 http://www.linuxidc.com/Linux/2013-03/80815.htm‘

Hadoop 安装部署笔记之 -HBase 完全分布模式安装 http://www.linuxidc.com/Linux/2012-12/76947.htm

单机版搭建 HBase 环境图文教程详解 http://www.linuxidc.com/Linux/2012-10/72959.htm

更多 CentOS 相关信息见 CentOS 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=14

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-20发表,共计7138字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中