每个OSD周期性(默认300秒)的向Monitor发送Beacon消息证明自己存活,如果Monitor一段时间(默认900秒)没收到OSD的Beacon,就标记OSD为down。OSDdown后超过600S,会被标记为out(Monitor通过 一个名为 mon_osd_down_out_subtree_limit 的配置项来限制自动数据迁移的粒度,例如设置为主机,则 当某个主机上的OSD全部宕掉时,...
正常情况下OSD的状态是up in状态,如果down掉OSD,它的状态会变为down in,等待数据均衡完成后osd变为down out状态,Ceph 会把其归置组迁移到其他OSD, CRUSH 就不会再分配归置组给它。 3. 查看OSD的状态 # 查看集群的osd状态# 查看指定osd的状态:ceph osd dump 3[root@node1 ~]# ceph osd dumpepoch242fsida...
正常情况下OSD的状态是up in状态,如果down掉OSD,它的状态会变为down in,等待数据均衡完成后osd变为down out状态,Ceph 会把其归置组迁移到其他OSD, CRUSH 就不会再分配归置组给它。 3. 查看OSD的状态 代码语言:javascript 代码运行次数:0 运行 AI代码解释 # 查看集群的osd状态 # 查看指定osd的状态:ceph osd...
cephadmin@ceph-deploy:~/ceph-cluster$ ceph-deploy osd create ceph-node1 --data /dev/sdf cephadmin@ceph-deploy:~/ceph-cluster$ ceph-deploy osd create ceph-node2 --data /dev/sdb cephadmin@ceph-deploy:~/ceph-cluster$ ceph-deploy osd create ceph-node2 --data /dev/sdc cephadmin@ceph-dep...
ceph-osd 软件包 osd == 硬盘 ceph-mon 软件包 监控(健康检查 , 检查服务是否正常) 绘制地图(地图文件记录服务地址, 实时检查osd存储状态, 并更新osd存储地图) 1 案例1:部署ceph准备 1.1 问题 准备四台虚拟机,其三台作为存储集群节点,一台安装为客户端,实现如下功能: ...
ceph osd out {osd-num} 执行完这一步后,会触发数据的恢复过程。此时应该等待数据恢复结束,集群恢复到 HEALTH_OK 状态,再进行下一步操作。 删除CRUSH Map 中的对应 OSD 条目,它就不再接收数据了。你也可以反编译 CRUSH Map、删除 device 列表条目、删除对应的 host 桶条目或删除 host 桶(如果它在 CRUSH Map...
正常情况下OSD的状态是up in状态,如果down掉OSD,它的状态会变为down in,等待数据均衡完成后osd变为down out状态,Ceph 会把其归置组迁移到其他OSD, CRUSH 就不会再分配归置组给它。 3. 查看OSD的状态 AI检测代码解析 # 查看集群的osd状态 # 查看指定osd的状态:ceph osd dump 3 ...
ceph查看已经out了的osd 在Ceph分布式储存系统中,OSD(Object Storage Daemon)是一种重要的组件,负责数据的读写操作以及数据的复制和平衡。但是在使用过程中,有时会出现OSD掉线或者已经out的情况。本文将介绍如何通过Ceph查看已经out了的OSD,以及如何处理这种情况。
start ceph-osd id={num} 1. 解除noout 标志。 复制 ceph osd unset noout 1. 1.3 OSD 没运行 通常情况下,简单地重启 ceph-osd 进程就可以让它重回集群并恢复。 OSD 起不来 如果你重启了集群,但其中一个 OSD 起不来,依次检查: 配置文件: 如果你新装的 OSD 不能启动,检查下配置文件,确保它符合规定(比...
这个命令将显示OSD的全局唯一ID,以及与之相关联的设备和主机等信息。 5. `ceph osd status` -显示Ceph集群中每个OSD的状态信息。这个命令报告当前OSD的运行情况,包括接收和发送的数据量、容错域和延迟等指标。通过监视OSD状态,您可以尽早发现并处理任何潜在的问题。 6. `ceph osd out {osd-id}` -从Ceph集群中...