Kudu是什么-快上网网站建设公司

Kudu是什么

这篇文章主要为大家展示了“Kudu是什么”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“Kudu是什么”这篇文章吧。

创新互联公司是一家专业提供清水企业网站建设,专注与网站设计、成都做网站、H5网站设计、小程序制作等业务。10年已为清水众多企业、政府机构等服务。创新互联专业网站设计公司优惠进行中。

kudu是什么？

kudu和Hbase类似也是一个分布式数据库，据官方给它的定位是提供”fast analytics on fast data”（在更新更及时的数据上做更快的分析）。

据说Cloudera曾经想直接通过修改HBase来支持kudu现在的功能，但是Kudu的数据模型和磁盘存储都与Hbase不同，改造会非常大，所以Cloudera决定干脆开发一个全新的存储系统。

0.作为Hadoop生态圈的一部分，对接生态系统的其他组件方便，会有官方提供的接口

1.kudu自己存储数据不依赖与HDFS存储；不依赖于zookeeper，将它的功能集成进了自身的TMaster；

2.和HBase类似的LSM结构，用于支持数据的随机读写。

3.有表结构，需定义Schema信息
- 必须定义唯一键，这就造成了写数据时多了一个判断唯一的过程。

需在写入数据前定义好每一列的类型（方便做类似于parquet的列式存储）
可以像关系型数据库一样用Alter增删列，不具有HBase动态列的特性

4.支持行级别的ACID

5.目前不支持二级索引

6.目前不支持BloomFilter优化join

7.核心模块用的C++来实现，没有full gc的风险

kudu解决了什么问题？

HDFS和HBase是大数据最常用的两种存储方式，它们的优缺点非常明显：

HDFS，使用列式存储格式Apache Parquet，Apache ORC，适合离线分析，不支持单条记录级别的update操作，随机读写性能差。这个就不多说了，用过HDFS的同学应该都知道这个特点。

HBase，可以进行高效随机读写，却并不适用于基于SQL的数据分析方向，大批量数据获取时的性能较差。

那为什么HBase不适合做分析呢？

因为分析需要批量获取数据，而HBase本身的设计并不适合批量获取数据

1）都说HBase是列式数据库，其实从底层存储的角度来说它并不是列式的，获取指定列数据时是会读到其他列数据的。看过我之前文章的同学应该比较清楚就不多说了。相对而言Parquet格式针对分析场景就做了很多优化。

2）HBase是LSM-Tree架构的数据库，这导致了HBase读取数据路径比较长，从内存到磁盘，可能还需要读多个HFile文件做版本合并。

LSM 的中心思想就是将随机写转换为顺序写来大幅提高写入操作的性能，但是牺牲了部分读的性能。
随机读写是指对任意一个位置的读和写，磁盘随机读写慢是因为需要寻道，倒带才可以访问到指定存储点，而内存不需要，可以任意指定存储点

为了让数据平台同时具备随机读写和批量分析能力，传统的做法是采用混合架构(hybrid architecture)，也就是我们常说的T+1的方式，数据实时更新在HBase，第二天凌晨同步到HDFS做离线分析。这样的缺点很明显，时效性差，数据链路长，过程复杂，开发成本高。

这个时候Kudu出现了，它是介于HDFS和HBase两者之间的一个东西如下图所示，

Kudu是什么

它不及HDFS批处理快，也不及HBase随机读写能力强，但是反过来它比HBase批处理快（适用于OLAP的分析场景），而且比HDFS随机读写能力强（适用于实时写入或者更新的场景），这就是它能解决的问题。

以上是“Kudu是什么”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注创新互联行业资讯频道！

网页题目：Kudu是什么
URL地址：http://www.cdkjz.cn/article/pjisjp.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Kudu是什么

kudu是什么？

kudu解决了什么问题？

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Kudu是什么

kudu是什么？

kudu解决了什么问题？

相关资讯

tk怎么申请域名 tk域名续费

linux远程命令转义符 linux命令行转义

tl路由器初始密码的简单介绍

路由器拔下来一次就连不了 路由器拔下来一次就连不了了

帝国cms首页相关文章 帝国cms相关文章调用

深信服服务器安全配置基线 深信服设备配置

腾讯云服务器远程控制不了 腾讯云远程连接失败老是掉线

路由器上mc 路由器上面的光信号显示红灯怎么回事

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

路由器拔下来一次就连不了路由器拔下来一次就连不了了

帝国cms首页相关文章帝国cms相关文章调用

深信服服务器安全配置基线深信服设备配置

腾讯云服务器远程控制不了腾讯云远程连接失败老是掉线

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接