资讯

精准传达 • 有效沟通

从品牌网站建设到网络营销策划,从策略到执行的一站式服务

HBase的特点有哪些

这篇文章主要为大家展示了“HBase的特点有哪些”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“HBase的特点有哪些”这篇文章吧。

成都创新互联服务紧随时代发展步伐,进行技术革新和技术进步,经过10多年的发展和积累,已经汇集了一批资深网站策划师、设计师、专业的网站实施团队以及高素质售后服务人员,并且完全形成了一套成熟的业务流程,能够完全依照客户要求对网站进行网站设计、网站建设、建设、维护、更新和改版,实现客户网站对外宣传展示的首要目的,并为客户企业品牌互联网化提供全面的解决方案。

            HBase是一个NOSQL的数据库产品,用于解决海量数据的毫秒级简单查询的问题.

            HBase的特点:

                                表(table)--用于存储数据的,数据也是存放在表中.

                                行(row)--嵌套的说法.

                                行键(row key)--类似于主键,也是用于区分每一行的.

                                列簇(column family)--列的集合.

                                列(column)--相当于RDBMS中的字段.

                                单元格(cell)--单元格用于存储数据的.

                                多个版本的数据--带有时间戳的数据.

                                hbase中的数据都是字节数组存储的,所以比较时按照一个个字节比较.

                                hbase中的记录是按照rowkey排序存储的.

                                hbase中的列簇根据大小划分为很多的region,不同的region可以存储在不同的region服务器中.那么

                                海量数据的查询就可以转换为并行查询了.

                                预分区操作是指的是在建表的时候,预先划分成指定数量的region,插入数据时均匀的分散到不

                                同的region中.

                                在hbase中,有一张表叫做.META.,里面存储的是用户表的regionserver与rowkey的映射关系.

                                在hbase中,有一张表叫做-ROOT-,里面存储的是.META.的rowkey与regionserver的映射关系.

                                表示hbase某张表中的一行记录,看rowkey确定一行记录.

                                行中有很多列,这些列分到很多列簇中存储.

                                每一行列簇是一个独立的存储文件.

关于Hbase的一些提问:

            问:为什么一行记录含有多个时间戳的值?

            答:因为这样能够体现聚合的思想,实际上体现了RDBMS中的一对多问题.

            问:为什么一行记录按照列簇分成独立的物理文件存储,而不是一行记录全部放到一起存储?

            答:因为查询时,一行记录并不是全部字段都需要,只需要一部分字段.如果一行记录所有字段的值放在一起的

                   话,那么一次性读取所有字段,显然很浪费.分别存储的话,一次查询只需要少量字段,那么整体的查询

                   吞吐量就会提高.

            问:建立索引时为什么key是regionserver,value是rowkey,而不是相反的哪?

            答:因为rowkey的数量太大了,按照上面的方式建立索引的话,映射数据流就太大.

            问:设计rowkey是hbase表设计中的重点?

            答:(1)因为hbase查询默认是按照rowkey查询,因此业务上最需要的查询条件应该设计到rowkey的组成中.

                   (2)因为hbase表分区的话,那么再插入数据的时候容易产生热点,为了避免热点,插入数据应该尽可能

                       随机,需要主要rowkey的设计,最好是rowkey的开始节点都是随机的或者接近随机的.

以上是“HBase的特点有哪些”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注创新互联行业资讯频道!


分享标题:HBase的特点有哪些
URL标题:http://www.cdkjz.cn/article/ghspds.html
多年建站经验

多一份参考,总有益处

联系快上网,免费获得专属《策划方案》及报价

咨询相关问题或预约面谈,可以通过以下方式与我们联系

大客户专线   成都:13518219792   座机:028-86922220