2. 检查硬件:硬件故障是引起Ceph命令卡住的另一个常见原因。检查存储节点、网络设备和主机,确保它们正常运行和连接。 3. 检查配置文件:检查Ceph集群的配置文件,确保其中没有任何错误或遗漏。特别注意MON和OSD的配置是否正确,并确保集群中所有节点的配置文件都是一致的。 4. 检查Ceph进程:使用"ceph -s"命令检查Ceph...
PG卡住在active+remapped+backfill_wait状态 这种情况常见于osd数据恢复途中遇到其他问题卡住,使得backfill过程卡住,解决办法很简单: 1、使用sudo ceph pg PGID query查询对应pg的状态 2、查看上述命令的输出中的backfill_targets字段,这个字段对应的就是卡住的osd 3、重启该osd PG进行scrub发现inconsistent的对象 scrub...
对于Dumpling 及后续版本,你可以用另一个(推荐的)命令: ceph daemon mon.<id><command> ceph工具的help命令会显示管理套接字支持的其它命令。请仔细了解一下config get、config show、mon_status和quorum_status命令,在排除 Mon 故障时它们会很有用。 1.3 理解 MON_STATUS 当集群形成法定人数后,或在没有形成法...
这种方法是可行的,尤其是对于较大范围的磁盘硬件故障这是一个相对稳妥且节省人力的方法 但是由于故障 SAS 盘读写速度也就 200MB/s 的峰值,即使保持这个速度,1.2TB 的盘同步完成也需要接近两小时,线上业务坐等两小时是无计可施的保底方法。 第二种方式:服务启动时跳过故障扇区来避免异常退出 解决方案 回过头仔细分...
5.2. ceph-mon起来后,ceph -s 命令无任何输出,卡住 5.3. 指定磁盘添加OSD时报错Device /dev/xxx has a filesystem. 1. 前言 参照本文档将指导您,如何在Ubuntu20.0.4服务器采用docker+cephadm方式安装 17.2版本的Ceph。 2. 环境准备 2.1. 主机信息 ...
如果池中有卷,如上命令会卡住,rook-ceph-operator-xxx中会提示错误log 首先删除全部池中的卷,然后重启rook-ceph-operator-xxx,然后重复执行 kubectl delete -f ceph -s ceph osd tree显示osd down,但是osd明明是running log显示时钟偏移,但是实际上始终偏差< 50ms ...
【思考】:做过ceph运维的小伙伴肯定会遇见一种情况就是执行ceph -s 或其他ceph命令时命令一直卡住,很长时间都没有反应,第一次遇见此情况的小伙伴甚至怀疑集群宕机了。 【实验】 禁止本机3300端口 #使用iptables 规制禁止了3300端口的访问 iptables -AINPUT-ptcp -m tcp--dport3300-j DROP ...
ERROR:系统卡住什么也不显示,只能手动切断该过程,所有ceph有关命令全部失效。那么就会报错:ERROR: missing keyring。也就是说,用户client.admin登陆 Ceph 系统失败! Error connecting to cluster: ObjectNotFound 解决办法:错误原因位系统不能找到Client:/etc/ceph/ceph.client.admin.keyring。通常我们执行ceph -s 时...
ceph中最常用的命令就是ceph -s。 我们通过ceph -s中显示的结果如下: 但是有时侯也会有这种情况: 那么下面这些PG的状态都是什么意思呢? 1 2 3 4 5 ceph -s 能够非常直观看到pg的状态,pg是数据存储的重要单位,在使用ceph的时候,pg会经常发生状态的变化,参考下面例子。