Ceph PG undersized 意味着某个 PG 的副本数少于期望值,这可能会导致数据的完整性和可靠性受到影响。造成 Ceph PG undersized 的原因可能有很多,比如 OSD(Object Storage Device)的故障、网络问题或者手动修改 CRUSH rule 等。 解决Ceph PG undersized 的方法也有很多种。首先,可以使用 ceph pg repair 命令手动修复...
降级就是在发生了一些故障比如OSD挂掉之后,ceph将这个OSD上的所有PG标记为degraded,但是此时的集群还是可以正常读写数据的,降级的PG只是相当于小感冒而已,并不是严重的问题,而另一个词undersized,我的理解就是当前存活的PG 0.44数为2,小于副本数3,将其做此标记,也不是严重的问题。 Peered 那么,什么才是PG的大病...
正常情况下,ceph状态是active+clean,即活跃且可读可写 实验环境osd有两个,pool数量有6个副本数为2,pg 161个 undersized+degraded undersized 活跃的pg数量(acting set)小于副本数 degraded osd down或者挂了,其上的pg将会处于降级状态 一个osd down,此时50%的object和35个pg被降级 手动将副本数由2改为1(6个po...
可见,它此刻的状态是active+undersized+degraded,当一个 PG 所在的 OSD 挂掉之后,这个 PG 就会进入undersized+degraded 状态,而后面的[0,2]的意义就是还有两个副本存活在 osd.0 和 osd.2 上, 并且这个时候客户端可以正常读写IO。
undersized PG 当前副本数小于其存储池定义的值(默认为3副本)的时候,PG 会转换为 undersized 状态,比如两个备份 OSD 都 down 了(只有1个osd在线),那么此时 PG 中就只有一个主 OSD 了,不符合 ceph 最少要求一个主 OSD 加一个备 OSD 的要求(2个osd在线则可以继续提供对外读写),那么就会导致...
UndersizedPG当前Acting Set小于存储池副本数 3. 状态详解及故障模拟复现 3.1 Degraded 3.1.1 说明 · 降级:由上文可以得知,每个PG有三个副本,分别保存在不同的OSD中,在非故障情况下,这个PG是active+clean 状态,那么,如果PG 的 副本osd.4 挂掉了,这个 PG 是降级状态。
对于无法根据PGLog计算丢失数据的PG,需要通过Backfill操作拷贝整个PG的数据来恢复。需要注意的是,在这Peering过程完成前,PG的数据都是不可靠的,因此在Peering过程中PG会暂停所有客户端的IO请求。 恢复受影响的数据 Peering完成后,PG进入Active状态,并根据PG的副本状态将自己标记为Degraded/Undersized状态,在Degraded状态下...
PG状态没有被任何OSD更新,这说明所有存储这个PG的OSD可能挂掉, 或者Mon没有检测到Primary统计信息(网络抖动)UndersizedPG当前Acting Set小于存储池副本数3. 状态详解及故障模拟复现3.1 Degraded3.1.1 说明 降级:由上文可以得知,每个PG有三个副本,分别保存在不同的OSD中,在非故障情况下,这个PG是active+clean 状态,...
Undersized PG当前Acting Set小于存储池副本数 3. 状态详解及故障模拟复现 3.1 Degraded 3.1.1 说明 • 降级:由上文可以得知,每个PG有三个副本,分别保存在不同的OSD中,在非故障情况下,这个PG是active+clean 状态,那么,如果PG 的 副本osd.4 挂掉了,这个 PG 是降级状态。 3.1.2 故障模拟 停止osd.1 $ syst...
正常情况下,ceph状态是active+clean,即活跃且可读可写 实验环境osd有两个,pool数量有6个副本数为2,pg 161个 undersized+degraded undersized 活跃的pg数量(acting set)小于副本数 degraded osd down或者挂了,其上的pg将会处于降级状态 一个osd down,此时50%的object和35个pg被降级 手动...