hbase的特点是什么??
1)hbase是一个分布式的基于列式存储的数据库,基于Hadoop的hdfs存储,zookeeper管理。
2)hbase适合存储半结构化和非结构化数据,对于结构化数据字段不够确定或者杂乱无章很难按一个概念去抽取数据;
3)hbase为空的纪录不会被存储;
4)基于的表包含rowkey,时间戳,列族,新写入数据时,时间戳更新,同时可以查询到以前的版本;
5)hbase是主从架构,hmaster作为主节点,hregionserver作为从节点。
描述一下hbase的rowkey的设计原则
1)rowkey的长度原则
rowkey是一个二进制码流,rowkey的长度被很多开发者 建议设计在10-100字节,不过建议越短越好,不要超过16字节。
原因如下:
a、数据的持久化文件hfile中是按照keyvalue存储的,如果rowkey过长比如100个字节,1000万列数据光rowkey就要占用100*100万=10亿字节,将近1G数据,着就会极大的影响hfile的存储效率。
b、menstore将缓存部分数据到内存,如果rowkey字段过长内存的有效利用效率会降低,系统将无法缓存更多的数据,这会降低检索效率,因此rowkey的长度越短越好,;
c、目前操作系统都是64位系统,内存8字节对齐,控制在16字节,8字节的整数倍利用操作系统的最佳特性。
2025年HBase面试题总结1「建议收藏」
HBase面试题总结1「建议收藏」hbase 的特点是什么 1 hbase 是一个分布式的基于列式存储的数据库 基于 Hadoop 的 hdfs 存储 zookeeper 管理 2 hbase 适合存储半结构化和非结构化数据 对于结构化数据字段不够确定或者杂乱无章很难按一个概念去抽取数据 3 hbase 为空的纪录不会被存储 4 基于的表包含 rowkey 时间戳 列族 新写入数据时 时间戳更新 同时可以查询到以前的版本
linux下的删除文件命令,Linux下删除文件命令「建议收藏」
上一篇
2025-08-09 17:46
2025年QListWidget的QSS用法「建议收藏」
下一篇
2025-04-19 12:30
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/hz/110965.html