除了PFC以外,RoCEv2对交换机的另一个功能需求就是ECN。ECN的功能需要借助WRED(Weighted Random Early Detection,加权随机早期检测)功能来读取队列长度,它会根据缓存使用量来设置打标场景,当队列长度不超过低阈值时,不标记;当队列长度超过低阈值而不超过高阈值时,概率标记;当队列长度超过高阈值时,100%ECN标记。一般而言...
当发送端收到 PFC 暂停帧时,发送端停止发送具有指定 802.1p 优先级的报文,直到发送端收到 PFC XON 帧或老化定时器超时。配置PFC时,特定类型报文的拥塞不影响其他类型报文的正常转发, ECN:显式拥塞通知。ECN 定义了基于 IP 层和传输层的流量控制和端到端拥塞通知机制。当设备拥塞时,ECN 会在数据包的 IP 头中...
数据中心量化拥塞通知 (DCQCN) 是 ECN 和 PFC 的组合,可支持端到端无损以太网。DCQCN 的设计理念是在拥塞时通过 ECN 让发送端降低传输速率,从而尽量避免触发 PFC,因为PFC被触发,发送流量会完全停止,DCQCN 需要考虑如下两个关键点: 确保PFC 不会太早触发,即先使用ECN发送拥塞反馈使流量变慢。 确保PFC 不会太...
ECN 和 PFC 在星飞全闪分布式存储中协同工作,在 RoCE 网络环境下形成了一个强大的流控体系。当网络拥塞发生时,ECN 首先通知发送方降低速率,同时 PFC 根据流量优先级确保关键业务的持续传输。例如,在存储系统进行大规模数据读写操作时,如果网络出现拥塞,ECN 会协调发送方调整发送速率,而 PFC 则保证存储数据的...
RoCE v2协议在原有基础上进行了显著优化,通过融合以太网网络层与UDP传输层,革新了RoCE协议的InfiniBand网络层。其独特之处在于,借助以太网网络层中IP数据报的DSCP和ECN字段,实现了高效的拥塞控制,赋予了数据包路由能力,极大地提升了可扩展性。因此,如今提及RoCE协议,多指RoCE v2,除非特指第一代RoCE。无丢包...
接下来,我们将通过一张图表来简要展示ECN与PFC之间的关联。源端依次发送Packet1至Packet5,当传输至Packet3时,网络拥塞触发ECN门限。此时,Device在数据包的DS字段进行置位,宿端接收到这一置位数据包后,便知晓网络拥塞情况,并发送CNP通知给源端。源端在收到CNP后,会相应地降低数据包的发送速率,从而完成ECN的...
由于RDMA要求承载网络无丢包,否则效率就会急剧下降,所以RoCE技术如果选用以太网进行承载,就需要通过PFC,ECN以及DCQCN等技术对传统以太网络改造,打造无损以太网络,以确保零丢包。 PFC:基于优先级的流量控制。PFC为多种类型的流量提供基于每跳优先级的流量控制。设备在转发报文时,通过在优先级映射表中查找报文的优先级,将...
由于RDMA要求网络传输性能无损“0”丢包,RoCE技术在以太网上承载,必须要解决以太网中的流量拥塞和丢包问题,现阶段已经有了一些比较成熟的拥塞流控技术,如PFC、ECN等,旨在提高转发效率,减少网络拥塞和丢包的发生,但两种技术控制方式略有不同。 PFC(Priority-Based Flow Control,基于优先级的流控):在交换机上对流量进行...
RoCEv2技术支持在以太网上承载RDMA协议,实现RDMA over Ethernet,但需要网络侧支持无损以太网。目前,星融元网络操作系统AsterNOS使用标准的PFC+ECN来实现无损以太网。在以太网交换机上配置PFC、ECN功能,需要用户熟悉QoS机制、配置逻辑和相关命令行。对此,星融元针对RoCEv2场景的配置需求进行设计规划,推出一键RoCE,实现了...
ECN机制能在网络中出现潜在拥塞时提前向流量源报告,从而促使其降低数据注入速率。每个RoCE队列对(QP),即与应用程序通信的发送和接收队列,都对应着NIC硬件资源,这些资源负责控制其注入速率。RoCEv2的PFC和ECN组合常被统称为数据中心量化拥塞通知(DCQCN)或RoCEv2拥塞管理(RCM)。DCQCN技术已成为RoCEv2部署中的...