使用dump_ops_in_flight命令可以显示OSD当前在Ceph中执行的所有操作,也可以使用dump_historic_slow_ops挖掘过去的慢操作。dump_historic_ops也可用于显示有关所有先前操作的日志消息。利用这些工具,更深入的监控成为可能:现在可以为单个慢速写入找到主OSD,然后所涉及的OSD揭示它计算了哪些辅助OSD的信息。例如,它们在同一...
"dump_historic_ops_by_duration":"show slowest recent ops, sorted by duration", "dump_historic_slow_ops":"show slowest recent ops", "dump_mempools":"get mempool stats", "dump_objectstore_kv_stats":"print statistics of kvdb which used by bluestore", "dump_op_pq_state":"dump op priority...
c、系统负载。 2、 使用 dump_historic_ops administration socket命令确定慢速请求的类型 3、 使用ceph osd perf确定慢速磁盘 @Lucien168: 这种情况,一般去查看集群端,是否存在slow request 请求的日志, 如果有相关的慢请求日志, 跟进日志分析问题, 看看是否是某块盘出现问题。 15、ceph如何进行监控体系建设从而更快...
c、系统负载。 2、 使用 dump_historic_ops administration socket命令确定慢速请求的类型 3、 使用ceph osd perf确定慢速磁盘 @Lucien168: 这种情况,一般去查看集群端,是否存在slow request 请求的日志, 如果有相关的慢请求日志, 跟进日志分析问题, 看看是否是某块盘出现问题。 15、ceph如何进行监控体系建设从而更快...
"connection scores dump": "show the scores used in connectivity-based elections", "connection scores reset": "reset the scores used in connectivity-based elections", "dump_historic_ops": "dump_historic_ops", "dump_mempools": "get mempool stats", ...
通过 ceph daemon osd.64 dump_historic_ops 查看这个osd上所有client的op的时延duration,确实存在处理时间较高的情况 通过 smartctl -a /dev/sdi 查看硬盘的寿命,确认ssd盘寿命已不足 执行 ceph osd pool set ssd min_size 1 调整为1 2.调整osd reweight,让pg不再分配读写到这个osd ceph osd...
"dump_historic_ops":"show slowest recent ops", "dump_op_pq_state":"dump op priority queue state", …… } root@test3:~#cephdaemon/var/run/ceph/ceph-mon.*.asokhelp {"add_bootstrap_peer_hint":"add peer address as potential bootstrap peer for cluster bringup", ...
通过ceph daemon osd.64 dump_historic_ops查看这个osd上所有client的op的时延duration,确实存在处理时间较高的情况 通过smartctl -a /dev/sdi查看硬盘的寿命,确认ssd盘寿命已不足 ssd盘寿命 在获取到硬盘的SMART值(VALUE)后我们就可以通过与THRESH值比对来获得硬盘当前的健康情况。其中重点关注以下几个值。
使用sudo ceph daemon osd.x dump_historic_ops来打印出这个osd的op处理流程情况 结果为 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
ceph daemon osd.ID dump_historic_ops image 上面是osd 121的信息,操作的对象是10000000388.00000000,op持续了426.153ms,主要耗费时间在网络读数据的延时和副本操作的延时。op开始时间16:04:19.049346,结束时间16:04:19.475499。 image 这是osd 130的信息,操作的对象是10000000388.00000001,op持续了439.539ms。op开始时...