加入收藏 | 设为首页 | 会员中心 | 我要投稿 衡阳站长网 (https://www.0734zz.cn/)- 数据集成、设备管理、备份、数据加密、智能搜索!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

弥补MySQL和Redis短板:看HBase怎么确保高可用

发布时间:2019-03-26 16:46:17 所属栏目:MySql教程 来源:张小渔
导读:HBase是一个基于Hadoop面向列的非关系型分布式数据库(NoSQL),设计概念来源于谷歌的BigTable模型,面向实时读写、随机访问大规模数据集的场景,是一个高可靠性、高性能、高伸缩的分布式存储系统,在大数据相关领域应用广泛。 HBase系统支持对所存储的数据

采集Regionserver Metric中的数据,主要采集数据包括:

  • Region的信息,上线region数量,store的数量、storefile的大小、storefileindex的大小,读取时memstore命中的次数和缺失次数;
  • blockcache的信息,例如blockcache中使用多少、空闲多少、累计的缺失率、命中率等;
  • 读写请求的统计信息,例如最大最小读写响应时间,读写的表分布、读写数据量、读写失败次数等;
  • compact与split的操作信息,例如队列的长度、操作次数和时间等;
  • handler的信息,例如队列长度、处于活跃handler的数量以及活跃的reader数量。

其他维度的指标如容器CPU以及Mem占用来自Kubernetes平台监控,磁盘IO,磁盘占用等来自主机监控:

弥补MySQL和Redis短板:看HBase怎么确保高可用

HBase部分监控

2、Kubas-Region-Inspector组件

  • 采集HBase表Region信息,通过HBaseAPI接口,获取每个HBaseRegion的数据统计信息,并将Region数据聚合成数据表信息;
  • 通过调用开源组件形成HBase集群Region分布的图表,对Region热点进行定位;

弥补MySQL和Redis短板:看HBase怎么确保高可用

HBaseRegion分布监控

通过以上模块采集的监控信息,基本可以描述在Kubernetes上运行的HBase集群的状态信息,并能够辅助运维管理人员对故障进行定位排除。

十二、Future Work

随着公司业务的快速发展,知乎的HBase平台业务同时也在不断的迭代优化,短期内我们会从以下几个方向进一步提升知乎HBase平台的管理服务能力:

  • 提升集群安全稳定性。加入HBase权限支持,进一步提升多租户访问下的安全隔离性;
  • 用户集群构建定制化。通过提供用户数据管理系统,向业务用户开放HBase构建接口,这样业务用户可以自行构建HBase集群,添加Phoniex等插件的支持;
  • 运维检测自动化。自动对集群扩容,自动热点检测以及转移等;

参考

[1]知乎基于Kubernetes的Kafka平台的设计和实现

https://zhuanlan.zhihu.com/ p/36366473

[2]知乎容器平台演进及与大数据融合实践

[3]Kubernetes

http://link.zhihu.com/?target=https%3A//kubernetes.io/

[4]Building online hbase cluster of zhihu based on kubernetes

【编辑推荐】

  1. Redis数据结构之简单动态字符串SDS
  2. 为什么MySQL数据库要用B+树存储索引?
  3. 基于Redis+MySQL+MongoDB存储架构应用
  4. NoSQL数据库服务之Redis
  5. Redis 布隆过滤器实战「缓存击穿、雪崩效应」
【责任编辑:武晓燕 TEL:(010)68476606】
点赞 0

(编辑:衡阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读