Skip to content

CDH介绍

1. CDH的发展

CDH(Cloudera Distribution Hadoop)是Hadoop众多分支中的一种,由Cloudera公司维护。从CDH6.3.3后开始不再提供免费版本使用,并且从2021年2月开始旧版本的安装包包括相关组件都需要会员下载(网上有分享CDH6.3.2的安装包)。
后来Cloudera与Hortonworks合并后,推出CDP7.1,它是第一个融合CDH和HDP所有组件并且可用于生产环境的版本。CDP仅提供试用60天,60天后将不能进入CM控制台。

2. CM简介

CDH中的CM(Cloudera Manager)进行集群安装、管理、监控报警功能的运维工具, 极大的提高集群管理的效率。
Alt text

3. CM架构

Alt text CM是一个web操作平台,可以安装多种大数据组件,CM的组成如下:

  • Cloudera Repository:软件由Cloudera管理分布存储库(类似Maven的仓库)。
  • Agent:安装在每台主机上。该代理负责启动和停止的过程,拆包配置,触发装置和监控主机。
  • Management Service:由一组执行各种监控,警报和报告功能角色的服务。
  • Database:存储配置和监视信息。通常情况下,多个逻辑数据库在一个或多个数据库服务器上运行。例如Cloudera的管理服务器和监控角色使用不同的逻辑数据库。
  • Clients:是用于与服务器进行交互的接口。
  • Admin Console:基于Web的用户界面与管理员管理集群和Cloudera管理。

4. CDH安装版本的选择

目前Cloudera提供最新CDP试用版(CM7.4.4+CDH7.1.8),主要组件版本如下:

组件版本组件版本
Hadoop3.1.1Hive3.1.3
Hbase2.4.6Spark2.4.8
Hue4.5.0jdkJava8
Impala4.0.0kudu1.13.0
Kafka3.1.1phoenix5.1.1
Oozie5.1.0ZooKeeper3.5.5
tez0.9.1zeppline0.8.2

CDH最后一个免费版本是CDH6.3.2(CM6.3.1+CDH6.3.2):
Alt text CDH6.3.2组件版本如下:

组件版本组件版本
Hadoop3.0.0Hive2.1.1
HBase2.1.0Hue4.2.0
Impala3.2.0Kafka2.2.1
kudu1.10.0Pig0.17.0
Oozie5.1.0sentry2.1.0
spark2.4.0Sqoop1.4.7
ZooKeeper3.4.5Parquet1.9.0