0610-6.2.0-如何在Redhat7.4安装CDH6.2-下

4.CDH安装

4.1.CDH集群安装向导


1.admin/admin登录到CM




2.同意license协议,点击继续



3.选择60试用,点击继续




4.点击“继续”




5.点击“继续”,输入集群名称,可以使用默认的“Cluster 1”。




6.输入主机IP或者名称,点击搜索找到主机后点击继续





7.点击“继续”




8.选择自定义存储库,输入cm的http地址




9.使用Parcel选择,点击“更多选项”,点击“-”删除其它所有地址,输入

http://172.31.6.83/cdh6.2,点击“保存更改”



10.点击“继续”,进入下一步安装jdk




11.点击“继续”,进入下一步配置ssh账号密码




12.点击“继续”,进入下一步,安装Cloudera Manager相关到各个节点



等待Agent安装完毕后,自动跳转到下一步开始分发Parcel

13.点击“继续”,进入下一步安装cdh到各个节点



14.点击“继续”,进入下一步主机检查,确保所有检查项均通过。CDH6.2多了一个检查网络性能,这是为新功能SDX服务的,这里不检查。我们只点击“Inspect Hosts”。Fayson的机器因为有多个Java版本有一些警告,此步忽略。




检查完成后,点击“显示检查器结果”。



15.回到安装页面,点击“Continue”,进入服务安装向导。




4.2.集群设置安装向导


1.选择需要安装的服务,Data Warehouse




2.点击“继续”,进入集群角色分配,一台机器作为管理节点,另外三台机器作为DataNode



注意:Activity Monitor和Telemetry Publisher不用选择任何主机,留空,即不安装,因为用不到。

3.点击“继续”,进入下一步,测试数据库连接




4.测试成功,点击“继续”,进入目录设置,此处使用默认默认目录,根据实际情况进行目录修改




5.点击“继续”,进入各个服务启动




6.安装成功,点击继续



7.安装成功后进入home管理界面







4.3.组件版本检查




可以看到Hadoop3.0,Flume1.9,HBase2.1,Hive2.1.1,Spark2.4,Hue4.2.0,Impala3.2,Kafka2.1.0,Kudu1.9,Oozie5.1,Pig0.17,Senty2.1,Solr7.4,Sqoop1.4.7,Zookeeper3.4.5等。

5.总结


1.从安装方式上来看,CDH6与CDH5变化不大,这也方便了CDH5的用户可以较为快速的迁移到CDH6,以及适应CDH6的安装与使用。

2.安装向导界面有一些变化,现在可以一目了然的看到一共多少步骤,以及每个步骤是干什么。

3.安装条件前置没有任何变化,包括防火墙,Selinux关闭,ntp同步等等。可以参考Fayson之前的文章《 》

4.进到主界面变化也不大,主要是Cloudera的logo变成了黑色,与Cloudera主页的整体风格一致。

5.在配置Cloudera Manager连接到数据库时的脚本有所变化。以前是/usr/share/cmf/schema/scm_prepare_database.sh,现在是/opt/cloudera/cm/schema/scm_prepare_database.sh

6.Cloudera Manager服务的状态在Redhat7通过systemctl status cloudera-scm-server查看是显示正确,而以前是不正确的,可以参考Fayson之前的文章《 》

7.Cloudera Manager的rpm安装包由之前的7个变成了6个,去掉了之前的JDK6的包,然后自带JDK1.8.0_181,将不再支持JDK1.7。

8.注意CM的安装除了下载rpm包以外,还要下载allkeys.asc文件,否则安装agent的时候会报以下错误:



9.对于离线安装CDH6.x,分发Parcel出现hash校验失败的问题,是因为在CM6中修复了一个bug,让它不再忽略由http服务器发送的“Content-Encoding”的header信息,但是我们在Redhat中安装的httpd服务,当它传输parcel文件时,默认会错误的设置“Content-Encoding”。于是CM server会错误的认为parcel文件已经被httpd压缩并尝试解压缩。所以会导致失败。解决办法是参考2.8章节的,设置httpd的conf文件,AddType application/x-gzip .gz .tgz .parcel,然后重启httpd服务和CM服务。这个问题在beta的时候就已经存在了,具体请参考《 》

10.与CDH6.1的安装相比,6.2有一些细微的差别,首先多了一个步骤可以自定义集群的名字,默认“Cluster 1”;另外在“检查主机”那个步骤,多了一个选项“检查网络性能”,这个功能是为CDH6.2的新功能SDX服务的,因为SDX是存储计算分离的架构,如果网络是瓶颈,可能并不适合SDX。