Hadoop系列五——HBase简介

2018-04-26 14:34:50 中國大數據

本文是对《 Hadoop系列四——HBase简介》一文的补充，不过本文不会进行系统性介绍，只是针对一个个独立的点介绍，并且会不断更新，有点类似于FAQ吧。

1. HBase的架构图

简易版架构图：

复杂版架构图：

架构讲解见《 Hadoop系列四——HBase简介》。

2. HBase的数据模型

在《 Hadoop系列四——HBase简介》里面已经介绍过HBase的数据模型了，但这个的确非常重要，这里再做一些补充。HBase是根据Google的Bigtable论文实现的开源版"Bigtable"，所以对Bigtable的描述同样适用于HBase：

A Bigtable is a sparse,distributed, persistentmulti-dimensional sorted map. The map is indexed by a row key, column key, and a timestamp; each value in the map is anuninterpreted array of bytes.

这里有几个关键词我已经加粗了，从这几个关键词可以引出来多个问题。

2.1 HBase里面的"NULL值"处理

第一个就是 sparse关键字。首先NULL值是RDBMS里面的概念，HBase里面其实没有这个概念，这里只是为了作对比，介绍稀疏性这个特性。我们把HBase想成一个二维矩阵(这样不准确，但有助于理解)，那么其实就是一个稀疏矩阵。在RDBMS里面，没有值的地方一般用NULL表示，虽然相比于其他类型，NULL占很小的空间（一般是1bit），但仍然是占空间的，在RDBMS里面这没有问题，主要有两个原因：(1)RDBMS里面数据量不会很大，目前RDBMS能承载的最大数据量一般也就是百万级别的。(2)如果把RDBMS也看成二维矩阵的话，一般RDBMS都属于稠密矩阵，所以NULL值不会占大多数。

但HBase不一样，它正好与RDBMS的特性相反：数据量很大，一般都大于百万级别(如果小于这个量级，那你该重新考虑是否有必要使用HBase了)；NULL值可能占很大部分，这个和HBase的设计使用有关系。比如一个表里面有1百万个列，有1千万行数据，每一行里面可能只有一小部分列有值，其他列都是“NULL值”(实质是没有值)。所以， 在HBase里面，"NULL值"是不存储的，即不占用任何存储。其实这个和稀疏矩阵的存储原理上是一样的，只存储有数据的cell的“坐标”及值，其它的默认就是NULL。当我们在HBase里面获取一行数据的时候，只会返回有数据的列，不像RDBMS会返回所有列，没有值的用NULL占位。

更多信息见本文“ HBase的逻辑存储和物理存储”部分。

2.2 分布式

想想如果因为性能或存储等不够了，需要将RDBMS扩展成分布式的，能否做到？也许可以做到，但一般是受限的，而且难度比较高，比如像业内的GreenPlum，如果还想要保证RDBMS的所有特性，那就只能用更好的硬件做垂直扩展了。但HBase本身就是分布式的，扩展一个HBase节点基本上没有什么难度。所以这也是很多企业选择HBase的一个非常重要的考量。

2.3 多维有序map

多维的概念在我的《 Hadoop系列四——HBase简介》里面已经讲过了。

有序之前也提过，在HBase里面，不论是内部存储，还是查询返回的数据，都是有序的：依次按照row key、Column Family、Column qualifier、Timestamp四个维度排序，时间戳是按照从新到旧排的，其它都是字典序。

2.4 HBase里面的数据是否有类型

上面对于value的描述是“ uninterpreted array of bytes”，也就是没有类型，默认按字节流解析（我们知道任何类型其实都可以按字节流其解析）。其实在HBase里面除了会被作为路径的名称之外，其它都是作为字节流的，也就是没有类型。具体就是：表名、Column Family会作为路径名，所以名称必须是合法的路径名，也就是必须是可打印字符；row key，Column qualifier、Cell都是没有类型的，也就是可以是任何数据。实际中，我们经常会在row key、Column qualifier中存储数据，而不光是cell里面。

3. HBase的逻辑存储和物理存储

引用

HBase:The Definitive Guide上的一幅图：

第一幅图（左上角）是HBase里面一个典型的表的逻辑图，里面有 cf1和cf2两个Column Family（以下简称CF），每个CF里面有两列。里面的红色和黄色小块表示有数据，其他地方都没有数据（如前面所说，是一个稀疏矩阵），多个层叠的部分表示有多个版本的数据。

第二幅图（右上角）也是一个逻辑图，主要为了说明以下几个点：

不同CF里面的数据是分开存储的；
同一个CF里面的数据是按照row key顺序存储的；
统一cell里面有多个版本的数据的时候，新版本数据在前，旧版本数据在后，这样方便先取到新版本数据。

第三幅图（右下角）是上面的逻辑存储在物理文件上的存储形式，需要注意以下几个点：

不同CF的数据是存储在不同的文件里面的（Storefile或HFile），这就是为什么我们要将要一起使用的数据字段定义在同一个Column Family的原因；
同一个文件里面还是按照row key、CF、Column qualifier排序的；
每一条数据里面都要存储Key(row key、Column Family、Column qualifier、Timestamp)和value。在RDBMS里面我们设计字段名时一般要求能够“见名知意”，但在HBase里面不推荐这样做， Key的设计在保证功能的前提下，越短越好（比如仅用一个字母表示），至于其含义可以其它地方记录，比如文档里面。

第四幅图（左下角）是为了说明查询时指定各个Key对性能的影响：

指定 row key可以大幅度提高查询性能，因为根据row key可以确定在哪些region上面查（也就是说可以跳过那些不包含该row key的region）。在scan命令里面，可以通过STARTROW和STOPROW指定row key范围。
指定 Column Family可以大幅度提高查询性能，因为根据CF可以确定跳过哪些Storefile/HFile，一般查询时都建议指定CF。
指定 Timestamp也可以较大幅度提高查询性能，因为每个Storefile会存储它所保存的所有数据的时间区间，如果所指定的Timestamp不在该区间内，则直接跳过。
指定 Column Qualifier和
Value的过滤条件可以提高查询性能，但提高的很少。因为必须把每个Cell的值读出来和指定的条件做对比。

4. Tall-Narrow or Flat-Wide表

Tall-Narrow也就是我们所说的“窄表”，Flat-Wide是“宽表”。举个例子，比如我们要存储一个用户的邮件信息：用户ID、邮件ID、邮件内容。如果按照Tall-Narrow的思想去设计，表结构可能是下面这样：

# 将用户id和邮件id拼接成row key，邮件内容作为一列数据userid-emailid, cf:emailbaody

如果按照 Tall-Narrow思路去设计，表结构可能是下面这样：

# userid为row key，emailid和emailbody作为两个列userid, cf:emailid, cf:emailbody

两种设计各有利弊，使用宽表的好处主要在于HBase的ACID特性仅限于行内，所以如果把所有数据都放在一行，那可以很好的利用其ACID特性。而窄表在实际使用中更加常见一些，因为HBase里面的的row key类似于RDBMS里面的主键，所以我们尽可能将要经常查询的维度放在row key里面，可以提高查询性能；另外一个表里面不推荐有太多的Column Family，一般1个最好，最多也不要超过3个，具体见本文“Column Family的数量”部分。

5. HBase的表和Column Family能不能修改

先说结论： 可以修改。使用alter命令可以修改表和Column Family，具体语法可以help "alter"查看。这里需要注意两点：

0.92版本之前，表必须先disable后才可以修改。之后的版本增加了一个配置项 hbase.online.schema.update.enable，如果设为true，那可以直接修改，不需要disable。但官方推荐生产环境最好还是先disable再修改，在线修改可能会引发一些问题。
修改动作并非立即生效，而是等待下一次 major compaction，Storefile重写之后才会生效。

6. HBase的Compaction

我们知道当MemStore里面的数据量达到一定值的时候，就会落盘形成StoreFile(HFile)，这样就会形成很多文件，而Compaction就是将这些文件合并成大文件。HBase里面有两种Compaction： Minor compactions和Major compactions

，主要有如下区别：

Minor compactions一次只选取少量存储在一起的文件做合并压缩，其结果就是一个store(或Column Family)的数据被合并成了多个大一些的Storefile，而Major compactions合并之后的结果是一个store(或Column Family)的数据全部到一个Storefile里面去了。
Minor compactions合并时不删除已经标记删除或者过期版本的数据，而Major compactions会删掉那些标记删除或过期版本的数据。所以需要注意，HBase里面的删除是标记删除，真正的物理删除发生在Major compactions阶段。

虽然Compaction合并文件是为了提高性能，但合并这个操作却是消耗资源的，就跟Jvm的GC一样。默认 Major compactions一周一次。

7. Column Family的数量

先说结论： 一个表内的Column Family最好1个，最多不要超过3个。原因主要有两点：

现在HBase的flush(MemStore满了之后就会flush)和Compaction操作都是基于region的，从前面的架构图中可以看到一个region里面是包含多个Column Family的，所以当region内的某个Column Family需要flush或Compaction的时候，和它处于同一region内的其它Column Family也会一起flush或Compaction，但它们可能只有少量新增数据，这就会浪费IO。
假设有两个Column Family：CF-A和CF-B，其中CF-A有一百万条数据，CF-B有一千万条数据。假设CF-A占了100个HFile，CF-B占了1000个HFile，因为数据写入的先后顺序，很可能CF-A的100个文件会被CF-B的1000个文件打散，本来可能一个RegionServer上面的region足够存储所有的CF-A的HFile了，现在可能被打散到多个RegionServer上面去了，这样查询CF-A的数据的时候效率就会降低。这种现象称为“Cardinality of ColumnFamilies”。

8. Value的版本数和TTL

版本数指我们之前说的Timestamp，和这个特性相关的设置有两个： max versions和min versions，其含义也很明确。max versions的默认值是1，min versions的默认值是0，表示不启用多版本这个特性，即往一个Cell里面重复写数据会覆盖，而不是保留多个版本。

min versions和HBase的TTL(time-to-live)一起使用。我们可以给Column Family设置一个TTL时间（单位为秒），时间到期后的row会自动被删除。如果一个Storefile里面的row全部是过期的，那么在minor compaction阶段这个Storefile会被删除，我们可以通过把hbase.store.delete.expired.storefile设置为false或者把min versions设置为非0值来关闭删除这个特性。

9. 选择HBase还是RDBMS

一般来说，这个选择是比较好做的。HBase、Impala等数据库的诞生并不是为了替代传统的RDBMS，只是为了解决新的RDBMS解决不了或者解决起来比较困难的问题。所以，如果你的数据量并不大（一般以百万为分界线），那一般应该优先选择RDBMS，毕竟RDBMS支持完善的ACID，SQL，多级索引，各种Join，完善的类型等丰富的特性，这些都是HBase所不具备的。

但如果你的数据量非常大，RDBMS已经无法支撑了，那就可以考虑HBase等分布式数据库了。但如果你的业务离不开RDBMS的一些特性（比如各种Join、SQL、完善的ACID等），那可能就需要考虑类似于GreenPlum这种MPP数据库了。

10. FAQ

HBase是否支持ACID？

HBase里面只支持受限的ACID(Atomicity, Consistency, Isolation, and Durability)：仅支持行内的ACID，跨行不支持。也就是对于同一行的操作是可以保证ACID的，但是多行操作是不行的。更多信息可参考： ACID in HBase 。

HBase和Hive如何选择？

这两个不是一个层级的东西，没有可比性。如果你还在这二者之间纠结，那可能你对它们有些误会，或者还不清楚你自己的需求。非要比的话，那就是HBase一般做实时查询；而Hive一般作为离线数据仓库，Hive后面是MapReduce/Spark，所以无法做到实时。

HBase支不支持join？

先说结论： 不支持。HBase读取数据时支持Get和Scan

（Get的后台实现是Scan的一种特殊情况而已）操作，RDBMS里面的join在HBase里面是不支持的，但我们可以在表设计上支持一定程度上的"join"操作，比如将需要join的字段拼接起来作为row key。

HBase支持SQL吗？

HBase不支持SQL，只提供了各种API。但Apache下有个Phoenix项目，通过该项目可以使用SQL语句操作HBase。

HBase的一个region多大合适？

注意，这里说的是region，不是RegionServer。一个region保持在10~50GB比较好。

HBase一个表包含多少个region比较好？

一般一个表包含50~100个region和1~2个Column Family比较好。

HBase的Cell里面存储的Value有大小限制吗？

没有，但一般不要超过10MB（对于MOB对象不要超过50MB）。如果超过了这个大小，可以将对象存到HDFS上面，然后再HBase里面存储HDFS路径。

HBase里面的daughter是什么？

HBase的region分裂的时候，分裂出来的两个新region称为"daughter"，原来的称为"parent"。

关于HBase还有两个核心的点：一个是row key的设计，另外一个就是HFile。目前计划后续会分别写两篇文章来介绍这两方面东西，有兴趣的可持续关注。

References：

Apache HBase Reference Guide(Version3.0.0-SNAPSHOT).
HBase:The Definitive Guide.

-->

2.1 HBase里面的"NULL值"处理

2.4 HBase里面的数据是否有类型

3. HBase的逻辑存储和物理存储

4. Tall-Narrow or Flat-Wide表

5. HBase的表和Column Family能不能修改

7. Column Family的数量

8. Value的版本数和TTL

9. 选择HBase还是RDBMS

分享到:

閱讀更多 中國大數據 的文章

關鍵字: Hadoop 技术简介

Hadoop：MapReduce多路径输入与多文件输出详解

Hadoop 伪分布式搭建指南

Hadoop 数据科学

Hadoop DataBase学习笔记

一步一步学习大数据：Hadoop 生态系统与场景

Hadoop 安装教程

php 操作 Hadoop

第四章 Hadoop 集群搭建

第七章 Hadoop 常用的 shell 命令

第二章 Hadoop 发展背景

不看就亏系列！这里有完整的 Hadoop 集群搭建教程，和最易懂的 Hadoop 概念！

大数据开发学习，Hadoop-HDFS详细介绍

03.04 大数据开发学习，Hadoop-HDFS详细介绍

03.02 看完就能独自把集群搭起来！Hadoop HDFS完全分布式环境搭建详解

03.01 Hadoop HDFS详细操作

Hbase教程菜鸟教程：Hadoop Hbase入门简介

Hadoop 3的主要优缺点

FastDFS、Hadoop、TiDB共同点与各自特点

Hadoop YARN：调度性能优化实践

SQL ON HADOOP 技术框架汇总

Hadoop 数据管理平台 Apache Falcon

深入浅出 Hadoop YARN

Hadoop、Spark等5种大数据框架对比，你的项目该用哪种？

Hadoop 企业级大数据管理平台CDH 安装Hadoop组件

Hadoop 基本 Shell命令

揭秘Apache Hadoop YARN，第一部分：集群和YARN基础

08.28 Hadoop 学习一:jdk配置

最全腾讯等BAT大数据面试99题：hadoop、java、spark、机器算法等

ELK hadoop hbase

系统学习大数据两大框架 hadoop 和spark

如何系统的学习大数据框架 hadoop 和spark？

大数据计算常用的分布式计算组件——Hadoop、Storm以及Spark

Nutch-Hadoop-MongoDB搭建分布式爬虫

好程序员：hadoop job 日志的查看

Hadoop 的主节点如何启动java程序？

hadoop上运行python——hadoop streaming：搭建数据分析体系79篇

Hadoop 面试，来看这篇就够了

Hadoop MapReduce v1 系统剖析

Hadoop 之上的数据建模-Data Vault 2.

Hadoop 回收站Trash知识点

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

刚刚:刚刚工作的毕业生，一个月只有2000多，是不是太少了？根据你城市消费水平来看啊，还有你从事的工作，假如你在二三线城市做一份事业单位或者是编制类的工作，薪资水平是随着你工作年限逐年增长的，而且在年终也有很多福利补贴待遇等等，算下来收入也是可观的，再举一个例:-毕业生 2000

为什么只有edg赚钱？

电竞行业作为一个新兴产业，这几年发展势头越来越好，IG战队，FPX战队先后夺得了s8-s9世界赛的冠军，据俱乐部知情人士透露，除了国内的几家豪门俱乐部之外，其他俱乐部基本都是亏钱在做的，当然EDG也是:-edg 赚钱:为什么只有edg赚钱？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

20000:网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？天猫旗舰店，或者淘宝旗舰店，或者京东旗舰店肯定包真，质量好，再说可以官方验证啊，不能图那十块五块的便宜，毕竟一个充电宝要用好久呢，一两年没问题的。:-罗马仕马仕毫安

我们买的新商品房还没有拿到房产证，怎么转卖最好？

没有取得房抄产证的房子可以转让。但如果确定无法取得房产证的，房产转让不受法律保袭护。一般情况下，只有取得房产证的房屋才能确定房屋产权人，才具有转让的条件。但如果房屋是合法取得的，以百后可以依法办理度房:-转卖房产证商品房拿到:我们买的新商品房还没有拿到房产证，怎么转卖最好？

为什么突厥人可以成功复国？是大唐的刀不锋利了么？

锋利突厥人你这样说只能说明你对历史非常不了解，我先用一句话概括突厥被大唐雄兵打的有多惨：三次灭国，背井离乡，远赴西亚，打不过，俺躲着你还不行吗？突厥的意思是中间怂起的头盔。其来历已经不可靠，可能有着匈奴、鲜卑或:-复国大唐:为什么突厥人可以成功复国？是大唐的刀不锋利了么？

小高层16层高楼间距60米哪一层比较好？

小高层 60:小高层16层高楼间距60米哪一层比较好？首先需要明白，选择层数居住与楼间距毫无关系，住在哪一层，肉眼看对面楼的距离，是相差不大的。设定楼间距60米，纯粹是混淆视听。其实，一幢楼的楼层总数确定的情况下，到底哪一层最佳？很简单，取总层数乘以黄金:-楼间距层高

金银花盆栽好养吗？怎么养？

金银花可以盆栽，很好养的！金银花，是忍冬科的常绿缠绕灌木，枝条柔韧修长，多攀爬或匍匐生长。金银花生性强健，在我国的很多南方省份野外很多地区都能看到它的身影，叶子常年翠绿，到夏季开花，飘香四溢。所以，有:-金银花盆栽:金银花盆栽好养吗？怎么养？

长城对于抵御古代匈奴和蒙古人起到了多大作用？

长城真的无用吗？在今天许多人认为长城无用，古代国家举国之力建造的长城不过只是文物，就连康熙都曾作诗讽刺，原文如下：万里经营到海涯，纷纷调发逐浮夸。当时用尽生民力，天下何曾属尔家。-康熙但真的如此吗？小:-匈奴抵御长城:长城对于抵御古代匈奴和蒙古人起到了多大作用？蒙古人

什么树可以嫁接腊梅？

腊梅只能嫁接在不同品种的腊梅上，其他的树种不行！腊梅的繁殖可以用播种，压条，嫁接，分株等繁殖方法。播种法因不易保持花卉的原有优良特性，且播种的优点是在于大量繁殖，而腊梅大都只需培植少量几株，故一般都不:-腊梅嫁接:什么树可以嫁接腊梅？

行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？

堪忧五一假期:行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？事实上，因为教育培训都是预收费用的模式。但凡有一点点规模的培训机构老师。在上半年，带课量是可以得到保证。:-课时量

在农村“立夏节”都有哪些民间习俗？

民间习俗农村:在农村“立夏节”都有哪些民间习俗？在农村“立夏节”都有哪些民间习俗一、农村立夏常见的习俗风俗活动：1、吃鸡蛋“立夏吃蛋”习俗由来已久，俗话说“立夏吃了蛋，夏天不疰夏”。据说立夏开始天气越来越热，村里小孩儿会有身体疲劳四肢无力的感觉，吃:-立夏节

男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？

失望分手看法:男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？你的这个问题特别的有趣，我觉得你先不要看你要怎么做才让他才能让他对你的印象有所改变，你要去看为什么是两个月之后可以在一起，这两个月他会用来做什么，为什么会有这两个月？例如他的身体碰到了什么样的问题吗？:-答应我

工程分包乙方人员伤残谁承担？

承担:工程分包乙方人员伤残谁承担？分包乙方分包致人伤残责任谁承担？严格来说，需要了解更多伤残原因才能区分的，作为非专业人士，自己发表一点浅见供题主参考：1、如果甲方是央企的话，他们合同中的责任、义务等条款内已经将自己的责任全部撇开了，更会:-乙方伤残

有哪些看起来毫不相关的两个历史人物实际上有过联系？

实际上:有哪些看起来毫不相关的两个历史人物实际上有过联系？历史人物联系这个词貌似太宽泛了，就好像有一个调皮的答案说的，胡亥和溥仪相隔2000多年，牵强的找，也有联系：都是亡国之君不是。我想题主的意思是两个看起来应该风马牛不相及的人物，在历史上居然是熟悉或是一个时代的:-毫不相关

13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？

法系车不保值，如果准备常开可以入手，性价比高，价格应该在二至三万之间，二手车一车一况，一况一价，居体价格看车况。:-钱能水泡:13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？世嘉自动挡

22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？

17年驾驶证二手:22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？建议买日系二手车，开顺了卖了，买新车，昂克赛拉无法再次出手时获得好价格，而且也不省油，开完日系车直接换德系:-昂克赛拉

如何骑车去台湾骑行？

骑车在台湾没有回归内地前，最好不要去台湾，一是国内政策不允许你去台湾，因为已停止了台湾个人游。二是你偷着去台湾旅游，安全没有保障，偷渡客在哪里也没有安全保障的。以后内地政策允许个人去台湾旅游了，建议那时再:-骑行台湾:如何骑车去台湾骑行？

本人预算5万左右，想买一辆二手法系车！求推荐？

预算:本人预算5万左右，想买一辆二手法系车！求推荐？ 5万预算5万元左右，想买一辆二手法系车？推荐东风标致老款308车型。1 5万元可以买标致308车况好的，没大事故呢，年限15年左右，公里数3万左右，手动档车型。2 标致308车型，底盘调教扎实，跑高速稳定:-法系二手

14年进口马自达5PK进口10年道奇酷威买哪个划算？

道奇你好，好高兴回答你的问题！14年进口马自达5和10年月道奇酷威个人感觉马自达5比较划算。新车价马5报价29.99万，酷威19.38万两款车都是原装进口，马5属于日系，酷威属于美系。两款车不属于同类车型:-酷威马自达 14年:14年进口马自达5PK进口10年道奇酷威买哪个划算？

2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

特殊津贴高校人才就要重视，河南省高校人才更要重视，这个人才不是评出了的，而是推荐出来的，没有推荐，连参评的资格都没有。国务院特殊津贴人员推荐，不推荐是百分百没希望，推荐了希望就非常，那么是什么是国务院特殊津贴:-河南大学并列 2020年:2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

本田CRV2019款1.5T舒适版油耗高吗？

李老猫说车为你非专业解答各种选车用车问题本田crv定位于一款紧凑级suv产品，主要对飚丰田荣放，日产奇骏，这款车整体市场表现非常突出，2019年全年累计销量为18.44万台，平均月销1.5万以上，其深:-舒适版本田油耗:本田CRV2019款1.5T舒适版油耗高吗？

国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？

1.世界经济遭到重创疫情影响之下，各行各业基本属于停工停产的状态，在世界经济趋于一体化的今天，停工停产势必会造成一系列的连锁反应，最后导致的结果可能会引发金融危机。2.世界格局可能发生改变美国仍是世界:-头脑风暴控制:国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？疫情国外

本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？

如果有15万元的预算，让你选择一台空间和动力都很不错的小型SUV，我觉得很多的读者都会想到本田XRV这款车型。因为本田XRV确实太出色了，和同级别的其他盒子SUV车型相比，这款车在空间和动力上都有优势:-xrv 自动:本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？本田豪华版

现在存款有14万，借了5万还没收回来，该做什么好？

何去何从:现在存款有14万，借了5万还没收回来，该做什么好？续租存款利息率较低，可以投资较高收益的项目，比如投资基金，一般情况下可获得6%一10%的回报。如果行情好可达到50%以上收益，去年不少基金超过这目标。目前受疫情影响，股市在低位震荡，也是基金投资的机会。一:-存款 2300

2070super和5700xt买哪个比较好？

如果是玩游戏毫无疑问选择n卡，也就是2070 suep。如果追求性价比可以选择a卡，也就是5700xt. 为什么游戏选n卡呢？首先游戏厂商针对n卡优化比较多，然后就是功耗小，然后N卡架构执行效率极高，:-:2070super和5700xt买哪个比较好？

生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？

二胎我是两个孩子的妈妈，曾经的我和你一样，生完宝宝我也抑郁了，我知道抑郁症真的很痛苦，产后的那段日子我整天都不开心，做什么事也没积极性，谁也不想搭理，别人给我说话我就觉得很烦。忍不住冲家人发脾气。每当一个:-生完抑郁:生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？发火

人这一生遇到的人和事为什么感觉都像是必然的经历？

感觉:人这一生遇到的人和事为什么感觉都像是必然的经历？正所谓有因必有果，所以你今天的因，就会产生明天的果。所以这一切你就会觉得是必然的。生活中大部分是普通人大家的生活规律，生活方式，大致相同。当你看到别人家庭的果，自己家也产生同样的果，你就会觉得这一切是:-人和经历

现在校内校外到底教的是美式英语还是英式英语还是混搭英语？

校内:现在校内校外到底教的是美式英语还是英式英语还是混搭英语？校外英式答案肯定是不唯一的！美式英语现在是主流，少量英式发音也个别存在！但对于孩子来说，肯定是混搭英语，因为孩子肯定不是一直一位老师教下去，肯定会换老师！而老师的发音肯定是既有英式的，也有美式的！就连一些英语:-美式英语

上有老下有小，我们真的跳不出这个人生循环了吗？

上有老魔咒:上有老下有小，我们真的跳不出这个人生循环了吗？的确如此，尽管现在不结婚，晚婚的人很多，但是从人类繁洐生息的历史和大多数人来看，成家立业，生儿育女，家庭仍是主流，一个人的生理，心理和生存需求決定了生存状态，生儿育女，瞻养父母即是义务责任，也是生活动:-下有小

如果外面正在下小雨，你会突然想起了谁？

想起:如果外面正在下小雨，你会突然想起了谁？我最不忘，还是秋日的雨夜，天又凉了几分，已经需要披上一件薄薄的外套了。临窗而望，眼见窗台上的几株小植物，叶片上沾了几滴小雨珠，我总喜欢，用小手电去照它们，这样的小水滴看起来晶莹晶莹的，有一种清清凉凉的:-小雨

初中同学许久未见大学期间突然联系请吃饭，态度还良好，我给推了，会不会让人很烦？

初中同学:初中同学许久未见大学期间突然联系请吃饭，态度还良好，我给推了，会不会让人很烦？吃饭许久未见，意思就是交情不怎么样，无功不受禄，人家凭什么那么热情，难道真的是多年一来忘不了咱们之间的同学情谊，倍感想念了吗，不是请帮忙、做业务、就是借钱，十有八九十借钱。我建议还是不要去的好，大家都很忙:-许久未见

现在我觉得认真对某个人说我喜欢你什么的这种话好恶心，我爱你更说不出口，好恶心，是什么心理？

出口心理:现在我觉得认真对某个人说我喜欢你什么的这种话好恶心，我爱你更说不出口，好恶心，是什么心理？爱你更多的是心里问题，可能对方还没有优秀到你满意的程度，更没有到那种离不开的地步！爱情最终还是要回归生活，而生活离不开两个人的相处，父母终究会老，孩子终究会飞，所以选择自己的伴侣尤为重要，你现在觉得恶心更:-喜欢你

剧版的《何以笙箫默》和《再见王沥川》哪一个更好看呢？

再见王沥川好看:剧版的《何以笙箫默》和《再见王沥川》哪一个更好看呢？《遇见王沥川》吧，高以翔的王沥川太招人稀罕了。长相，身材，家世，人品，才能样样好，简直完美，挑不出任何毛病，实在要说一个缺点的话，那就是太tm完美，天妒英才、才让他饱受病魔折磨。偶像剧、深情帅气的男主:-何以笙箫默

计算机专业本科能够进入字节跳动、华为这些公司做开发吗？是否还需要继续读研？

学历是求职必备条件。有了工作不能停止对知识的探索。更高的学历，可以让你有更专业的技术能力和学习能力，可以让你拓展自己的交际圈，可以让你更知名。总之，活到老，学到老，学习对人总是有好处的，技多不压身嘛！:-字节跳动:计算机专业本科能够进入字节跳动、华为这些公司做开发吗？是否还需要继续读研？读研计算机专业

生完二胎的你们，现在有什么感想？

二胎家庭日常是什么样的？是不是觉得家里多了一个小人儿，温馨多了？不存在的！生二胎根本是妈妈们的渡劫磨砺！以前周末睡到自然醒，现在全年无休，时刻警醒着，能睡一次懒觉跟过年似的，黑眼圈不说，头发呼啦啦地掉:-生完二胎感想:生完二胎的你们，现在有什么感想？

华北适合种植蚕豆吗？

华北适合种植蚕豆，种蚕豆的面积大，在西北，华北，都在种植蚕豆，蚕豆茎秆根部有根瘤菌是种植其它农作物的好茬地，特别是土壤培养和防病虫害起到作用。:-蚕豆种植适合:华北适合种植蚕豆吗？华北

华为手机更新EMUI10.1系统后效果咋样？

大家知道现在智能手机的性能不仅仅跟智能手机的硬件有关，还跟智能手机的系统软件息息相关，在国产智能手机操作系统里，小米的MIUI系统跟华为的EMUI系统都是比较优秀的操作系统。最近小米推出了小米MIUI:-咋样华为华为手机更新:华为手机更新EMUI10.1系统后效果咋样？

大热天蜜蜂老是爬到箱外结群正常吗？

蜜蜂爬到:大热天蜜蜂老是爬到箱外结群正常吗？盗蜂现在正是夏季，很多地方蜜源稀少，蜂群中可能缺蜜，也是胡蜂猖獗的时间，所以蜂群中是非常容易发生盗蜂的。在蜂群中发生盗蜂的时候，蜂群守卫蜂会增多，但是这种情况引发的蜜蜂在蜂箱外一般不会结团，只是蜜蜂来:-大热天

辣椒正是生长最佳期，偏偏有的辣椒苗蔫，不是病虫害是咋回事？

最佳期雾都山客来回答您的问题。最近山客家乡的村民正在进行辣椒移栽，确实有像题主提到的情形，辣椒苗移栽前长势葱葱，嫩绿喜人，但是移栽后几天内就出现萎蔫现象，细心观察也不是被病虫害危害。那究竟是什么原因导致辣椒:-苗蔫辣椒咋回事:辣椒正是生长最佳期，偏偏有的辣椒苗蔫，不是病虫害是咋回事？

手机相机发展的最终形态会是怎样的？

最近这几年手机在电子产品行业里可谓是发展速度非常快，苹果和华为两大公司可以说也是，明争暗斗，产品一次比一次有卖点，前一段时间华为和苹果还都推出了手机新品，两家都在大力宣传强调着拍照功能，像iPhone:-形态相机手机最终:手机相机发展的最终形态会是怎样的？

华为为什么不出一款5寸全面屏手机呢？我想应该会有很多人支持吧？

5寸手机支持:华为为什么不出一款5寸全面屏手机呢？我想应该会有很多人支持吧？很高兴回答你的问题，刷头条刷出来的问题，看到很多人回答，感觉还有一些观点没有写出，所以我来回答一下。首先，华为为什么不出小尺寸全面屏手机？其实并不只有华为一家没有出小屏手机，放眼近期各大手机厂商发布的:-华为

生吃山芋，生吃胡萝卜，还有哪些蔬菜可以生吃呢？

胡萝卜蔬菜:生吃山芋，生吃胡萝卜，还有哪些蔬菜可以生吃呢？第一种，黄瓜。这个瓜，可不是菜市场中堆放满满的青瓜。各位可要睁大眼睛看清楚了，这个黄瓜，青中带黄，品种属以前乡下农户少量种植的，形态上面来看这种瓜矮、短、圆，表面覆盖有比较淡的细毛，经水轻轻冲洗之后整:-山芋

为什么马铃薯不宜过早过迟播种？

不宜:为什么马铃薯不宜过早过迟播种？播种过早为什么马铃薯不宜过早过迟播种？马铃薯的种植主要是由于气候条件的限制，过早出苗后容易遇到低温被冻死，种植晚了容易遇到干旱和高温，影响产量。马铃薯种植时间的早晚必须根据种植地方的气候条件来确定。马铃薯生长:-马铃薯

疫情愈发严重，原油为何反而大涨？

原油愈发:疫情愈发严重，原油为何反而大涨？疫情愈发严重和原油大涨没有必然关系。但是资金总是从高处流向低处，原油价格跌的越多，投资价值越明显，相对于其他产业更有投资价值。举个例子：深圳南山房价均价大约6万左右，宝安均价5万左右，如果南山房价涨到:-疫情

生菜球很好吃，怎么种植才能高产呢？

种植:生菜球很好吃，怎么种植才能高产呢？高产对环境条件的要求、1.温度生菜球为喜冷凉、忌高温作物，种子在4度以上可发芽、以15～20度为发芽适温。幼苗能耐较低温度，日平均温度12度时生长壮健，叶球生长最适温度为13～16度。不过目前有些结球生菜:-生菜

装修高手来帮忙看下144平，套内122平，怎么三房改四房？？

看下这个户型三房改四房，改一个小房间，应该没有问题。△原户型图这个户型改四房，能改的方案比较多，但是修改以后是否好用，是一件值得考虑的事情。一、主卧室变为两个卧室可以将主卧室改为两个卧室，但是这样的改动占:-房改 122:装修高手来帮忙看下144平，套内122平，怎么三房改四房？？ 144

大家帮忙看看这个房子如果要砸墙的话，怎么改比较好？

房子:大家帮忙看看这个房子如果要砸墙的话，怎么改比较好？这个户型砸墙，当然可以砸墙，但是在砸墙之前，要搞清楚为什么要砸墙，砸墙以后有什么优劣。△原户型原户型图上的白色墙体部分不是承重墙，理论上说否可以砸掉。但是外墙和与旁边户型或者是公共区域的共用墙体和图上:-帮忙

意蜂夏季喝什么水降温？

降温意蜂夏季喝什么水降温？气温高，蜂巢温度高的情况下，蜜蜂是通过采水的办法挂在蜂箱的四壁来蒸发带走热量，降低蜂巢温度同时也能帮助蜂群维持正常的湿度。在平常的情况下，蜜蜂是在室外采自然水的。夏季消耗的水量:-意蜂夏季:意蜂夏季喝什么水降温？

黄瓜种子催芽后种植需要打底水吗？

黄瓜种子:黄瓜种子催芽后种植需要打底水吗？你好很高兴回答这个问题。答案：不用。1-2天可出芽。黄瓜种子催芽：选用饱满的种子，用30℃水浸泡4小时后催芽。也可用100倍福尔马林溶液浸泡种子10-20分钟，洗净后清水浸种3-4小时，然后于25-3:-催芽黄瓜打底

书友们展示一下自我感觉发挥较好的作品，一起学习？

自我较好这幅作品是参赛的，色彩的搭配，纸张的拼接都是自己设计完成的，一如既往的清新淡雅感觉。书体用的魏碑中楷书，增加了书写的趣味性。:-书友展示:书友们展示一下自我感觉发挥较好的作品，一起学习？

Hadoop系列五——HBase简介

1. HBase的架构图

2. HBase的数据模型

2.1 HBase里面的"NULL值"处理

2.2 分布式

2.3 多维有序map

2.4 HBase里面的数据是否有类型

3. HBase的逻辑存储和物理存储

4. Tall-Narrow or Flat-Wide表

5. HBase的表和Column Family能不能修改

6. HBase的Compaction

7. Column Family的数量

8. Value的版本数和TTL

9. 选择HBase还是RDBMS

10. FAQ

HBase的Cell里面存储的Value有大小限制吗？

References：

相關文章:

Hadoop：MapReduce多路径输入与多文件输出详解

Hadoop 伪分布式搭建指南

Hadoop 数据科学

Hadoop DataBase学习笔记

一步一步学习大数据：Hadoop 生态系统与场景

Hadoop 安装教程

php 操作 Hadoop

第四章 Hadoop 集群搭建

第七章 Hadoop 常用的 shell 命令

第二章 Hadoop 发展背景

不看就亏系列！这里有完整的 Hadoop 集群搭建教程，和最易懂的 Hadoop 概念！

大数据开发学习，Hadoop-HDFS详细介绍

03.04 大数据开发学习，Hadoop-HDFS详细介绍

03.02 看完就能独自把集群搭起来！Hadoop HDFS完全分布式环境搭建详解

03.01 Hadoop HDFS详细操作

Hbase教程菜鸟教程：Hadoop Hbase入门简介

Hadoop 3的主要优缺点

FastDFS、Hadoop、TiDB共同点与各自特点

Hadoop YARN：调度性能优化实践

SQL ON HADOOP 技术框架汇总

Hadoop 数据管理平台 Apache Falcon

深入浅出 Hadoop YARN

Hadoop、Spark等5种大数据框架对比，你的项目该用哪种？

Hadoop 企业级大数据管理平台CDH 安装Hadoop组件

Hadoop 基本 Shell命令

揭秘Apache Hadoop YARN，第一部分：集群和YARN基础

08.28 Hadoop 学习一:jdk配置

最全腾讯等BAT大数据面试99题：hadoop、java、spark、机器算法等

ELK hadoop hbase

系统学习大数据两大框架 hadoop 和spark

如何系统的学习大数据框架 hadoop 和spark？

大数据计算常用的分布式计算组件——Hadoop、Storm以及Spark

Nutch-Hadoop-MongoDB搭建分布式爬虫

好程序员：hadoop job 日志的查看

Hadoop 的主节点如何启动java程序？

hadoop上运行python——hadoop streaming：搭建数据分析体系79篇

Hadoop 面试，来看这篇就够了

Hadoop MapReduce v1 系统剖析

Hadoop 之上的数据建模-Data Vault 2.

Hadoop 回收站Trash知识点

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

为什么只有edg赚钱？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

我们买的新商品房还没有拿到房产证，怎么转卖最好？

为什么突厥人可以成功复国？是大唐的刀不锋利了么？

小高层16层高楼间距60米哪一层比较好？

金银花盆栽好养吗？怎么养？

长城对于抵御古代匈奴和蒙古人起到了多大作用？

什么树可以嫁接腊梅？

行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？

在农村“立夏节”都有哪些民间习俗？

男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？

工程分包乙方人员伤残谁承担？

有哪些看起来毫不相关的两个历史人物实际上有过联系？

13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？

22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？

如何骑车去台湾骑行？

本人预算5万左右，想买一辆二手法系车！求推荐？

14年进口马自达5PK进口10年道奇酷威买哪个划算？

2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

本田CRV2019款1.5T舒适版油耗高吗？

国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？

装修高手来帮忙看下144平，套内122平，怎么三房改四房？？