『字节青训营-4th-大数据』L10:深入浅出 HBase 实战

HBase 适用场景
什么是 HBase

HBase 和关系型数据库的区别

HBase 数据模型



这种类 JSON 的格式看上去也是很清晰的

使用场景

典型应用

半结构化 / 字典序有序索引的数据

“近在线” 海量分布式 KV / 宽表存储


写密集的高吞吐场景

HBase 数据模型的优缺点

架构设计
HBase 架构设计

HMaster 主要职责


RegionServer 主要职责


ZooKeeper 主要职责

ThriftServer 主要职责

大数据支撑
HBase 在大数据生态的定位

水平扩展能力

Region 热点切分

切分点选取




切分过程




流量设计

Region 碎片整合

流程设计

Region 负载均衡

调度策略

其他策略

故障恢复机制
HMaster



RegionServer


Distributed Log Split 原理

具体流程



优化空间

最佳实践
Rowkey 设计策略

Column Family 设计策略

参数调优经验

ByteTable - 字节跳动自研分布式表格存储系统

总结

评论
GiscusTwikoo