DCQCN算法只是基于ECN/CNP让发送方降速而不是停止发送,而PFC的PAUSE消息比较狠,直接让上游端口停止发送任何数据。因此PFC总是能快速消除拥塞。05性能评测DCQCN实际效果见下图,论文中最多评测了10打1的incast流量: 06总 结 本文详细翻译和介绍了DCQCN论文的关键章节。在有DCQCN之前,RoCE v2只能通过PFC做拥塞控制,有...
DCQCN将网络中的节点分为三个角色,分别是: RP(reaction point): 即发送方网卡 CP(congestion point): 即交换机 NP(notification point): 即接收方网卡 DCQCN中的三种角色 DCQCN算法过程如下图所示,分为几个部分: 降速事件和降速过程 升速事件和升速过程 alpha更新过程 这篇文章介绍的非常详细,此处不再赘述,...
hccn_tool [-i %d] -dcqcn -g param [alg_mode %d] 命令功能 获取DCQCN的算法参数信息。 参数说明 参数 说明 -i 指定设备ID。 -dcqcn 指定dcqcn。 -g 获取属性。 param 参数信息。 alg_mode 算法模式。取值0、1,默认值为0。 0:DCQCN;1:预留。 返回值 0:成功 非0:失败 使用样例 ...
基于速率的拥塞控制:DCQCN是一种基于速率的拥塞控制方案。我们采用基于速率的算法,因为它比基于窗口的算法更容易实现,并且允许更细粒度的控制。 参数设置:DCQCN 基于 DCTCP 和 QCN,但在关键方面有所不同。因此DCTCP和QCN推荐的参数设置不能盲目地与DCQCN一起使用。 PFC仍然是必需的:DCQCN 并不能消除对 PFC 的依...
hccn_tool [-i %d] -dcqcn -gparam[alg_mode %d] 命令功能 获取DCQCN的算法参数信息。 参数说明 参数 说明 -i 指定设备ID。 对于Atlas 200T A2 Box16 异构子框,取值范围:0~15。 对于Atlas 800T A2 训练服务器、Atlas 800I A2 推理服务器、A200I A2 Box 异构组件和Atlas 900 A2 PoD 集群基础单元,...
hccn_tool -i 0 -dcqcn -g param alg_mode 0 获取设备0的算法参数信息。 f : 5 g_shift : 7 alpha_min : 64 tkp_shift : 3 max_speed : 200000 ai : 100 tmp_shift : 6 alp : 32 cnp_time : 10 alpha_shift : 10 alg_mode : 0 ...