统计中间件稳定性指标

发布于:2024-12-05 ⋅ 阅读:(54) ⋅ 点赞:(0)

目前订单业务域涉及中间件:MySQL、Redis、TiDB、MQ、ES。(遗漏项请补充)

一、RDS

  1. 资源使用率

实例ID 实例名称 规格 maxCPU avgCPU maxDISK maxIOPS avgIOPS 活跃会话 maxTPS avgTPS maxQPS avgQPS 实例风险

  1. 慢查询

慢查询会消耗大量的系统资源,包括 CPU 和内存,增加数据库的负载,导致并发性能下降,从而影响数据库整体性能下降,拖慢应用程序的响应速度。

  1. 存在慢查的实例列表

实例ID 实例名称 慢查数量【日】 SQL 最大执行耗时【秒】 建议 风险等级

  1. 大表

  1. 大表的定义

    请按照一个叶子结点的内存大小与主键、以及一行数据的大小的计算
  2. 大表带来的问题

    1. 产生慢查询:很难在一定的时间内过滤出所需要的数据,查询过大表的小伙伴应该深有体会。

    2. 深分页效率低:如果表中的数据量比较大,当进行深分页查询的时候,sql的执行时间会变的比较慢。

    3. 表结构变更时间较长:当进行DDL变更时、需要将表重新拷贝,如果表数据量过大,拷贝周期会很长、也会造成长时间的主从延迟。

    4. 资源消耗较大:表数据量过大不止会占用更多的磁盘空间,由于阿里云规格限制,大表过多会导致实例被迫升配。

  3. 存在大表的实例列表

实例ID 实例名称 数据库 表名 记录数 总大小(GB) 表注释 风险等级

  1. 磁盘使用率

阿里云实例存在规格限制,2C16G规格磁盘上限2T、8C32G/16C64G规格磁盘上限3T、32C128G规格磁盘上限6T。当磁盘超过规格限制时只能进行升配。同时磁盘使用率较高,变更大表时会导致容量不足。

  1. 磁盘使用率较高实例列表

实例ID 实例名称 规格 磁盘使用率 日增 预估可用天数 风险等级

二、Redis

  1. 资源使用率

实例ID 实例名称 规格 maxCPU avgCPU maxMemory avgMemory maxQPS avgQPS maxNetwork avgNetwork 风险等级

  1. 大Key(value > 10240bytes)

  1. 大Key引发的问题

    1. 客户端执行命令的时长变慢。

    2. 对大Key执行读请求,会使实例的带宽使用率被占满,导致自身服务变慢,同时易波及相关的服务。

    3. 对大Key执行删除操作,易造成主库较长时间的阻塞,进而可能引发同步中断或主从切换。

  2. 存在大key的实例列表

实例ID 实例名称 key名称 qps key大小(bytes) key类型 风险等级

  1. 热Key(qps > 500的key)

  1. 热Key引发的问题

    1. 占用大量的CPU资源,影响其他请求并导致整体性能降低。

    2. 对热Key的读请求,并且key较大时,很容易将实例的带宽打满。

  2. 存在热key的实例列表

实例ID 实例名称 key名称 qps key大小(bytes) key类型 风险等级

三、TiDB

  1. tidb-seller-order集群-ticdc

集群5.3.3版本,涉及tidb server、pd server、tikv server、ticdc server组件。其中ticdc为数据同步组件。ticdc在低版本中不够稳定,偶发会出现数据同步延迟的情况,官方建议将集群升级为7.1.5版本。


ID Role Host Ports OS/Arch Status Data Dir Deploy Dir -- ---- ---- ----- ------- ------ -------- ----------

四、MQ

mq消费速率如何统计,统计数据如果有误,会给生产带来误导。

统计方式:记录每条数据的耗费时间 统计取平均值。或者 压测。

实例ID NameServer地址 订阅组 消息生产速率 消费速率 key类型 风险等级