CDH介绍
1. CDH的发展
CDH(Cloudera Distribution Hadoop)是Hadoop众多分支中的一种,由Cloudera公司维护。从CDH6.3.3后开始不再提供免费版本使用,并且从2021年2月开始旧版本的安装包包括相关组件都需要会员下载(网上有分享CDH6.3.2的安装包)。
后来Cloudera与Hortonworks合并后,推出CDP7.1,它是第一个融合CDH和HDP所有组件并且可用于生产环境的版本。CDP仅提供试用60天,60天后将不能进入CM控制台。
2. CM简介
CDH中的CM(Cloudera Manager)进行集群安装、管理、监控报警功能的运维工具, 极大的提高集群管理的效率。
3. CM架构
CM是一个web操作平台,可以安装多种大数据组件,CM的组成如下:
- Cloudera Repository:软件由Cloudera管理分布存储库(类似Maven的仓库)。
- Agent:安装在每台主机上。该代理负责启动和停止的过程,拆包配置,触发装置和监控主机。
- Management Service:由一组执行各种监控,警报和报告功能角色的服务。
- Database:存储配置和监视信息。通常情况下,多个逻辑数据库在一个或多个数据库服务器上运行。例如Cloudera的管理服务器和监控角色使用不同的逻辑数据库。
- Clients:是用于与服务器进行交互的接口。
- Admin Console:基于Web的用户界面与管理员管理集群和Cloudera管理。
4. CDH安装版本的选择
目前Cloudera提供最新CDP试用版(CM7.4.4+CDH7.1.8),主要组件版本如下:
组件 | 版本 | 组件 | 版本 |
---|---|---|---|
Hadoop | 3.1.1 | Hive | 3.1.3 |
Hbase | 2.4.6 | Spark | 2.4.8 |
Hue | 4.5.0 | jdk | Java8 |
Impala | 4.0.0 | kudu | 1.13.0 |
Kafka | 3.1.1 | phoenix | 5.1.1 |
Oozie | 5.1.0 | ZooKeeper | 3.5.5 |
tez | 0.9.1 | zeppline | 0.8.2 |
CDH最后一个免费版本是CDH6.3.2(CM6.3.1+CDH6.3.2): CDH6.3.2组件版本如下:
组件 | 版本 | 组件 | 版本 |
---|---|---|---|
Hadoop | 3.0.0 | Hive | 2.1.1 |
HBase | 2.1.0 | Hue | 4.2.0 |
Impala | 3.2.0 | Kafka | 2.2.1 |
kudu | 1.10.0 | Pig | 0.17.0 |
Oozie | 5.1.0 | sentry | 2.1.0 |
spark | 2.4.0 | Sqoop | 1.4.7 |
ZooKeeper | 3.4.5 | Parquet | 1.9.0 |