hccn_tool [-i %d] -dcqcn -s [cnp_dscp %d] 命令功能 配置DCQCN的cnp的dscp报文优先级信息。 参数说明 参数 说明 -i 指定设备ID。 对于Atlas 200T A2 Box16 异构子框,取值范围:0~15。 对于Atlas 800T A2 训练服务器、Atlas 800I A2 推理服务器、A200I A2 Box 异构组件和Atlas 900 A2 PoD 集群...
获取DCQCN的cnp_dscp信息。 参数说明 参数 说明 -i 指定设备ID。对于Atlas 200T A2 Box16 异构子框,取值范围:0~15。对于Atlas 800T A2 训练服务器、Atlas 800I A2 推理服务器和Atlas 900 A2 PoD 集群基础单元,取值范围:0~7。 -dcqcn 指定dcqcn。
NP接收方网卡上的算法:当ECN标记后的报文到达接收方网卡,这表明网络上发生了拥塞,接收方网卡将该信息转换为CNP(Congestion Notification Packets)后反馈给发送方。CNP是RoCE v2规范中定义的拥塞通知方式。 NP上的算法主要用于决定CNP报生成的频率,比如可以每收到一个ECN就反馈一个CNP,也可以规定50us内最多反馈一个CN...
发送拥塞通知包CNP给发送端, 这时候假如发送端收到多个接收端发来的ECN包, 发送方需要有一个分布式拥塞控制算法(DCQCN, 由Mellanox和微软共同开发), 来降速和调度发送, 一段时间发端没有收到CNP时, 这个时候需要恢复流量, 目前是按照三个阶段来恢复, 快速恢复FR(fast recovery) -> 二分递增AI(additive...
CNP: congestion notification packet 拥塞通知包 RP: reaction point 响应通知的一端(被动方) NP: notification point 发起通知的一端(主动方) TO: trade off, 权衡 BDP: bandwidth-delay product 在数据通信中,带宽延迟乘积是数据链路容量(以比特/秒为单位)与其往返延迟时间(以秒为单位)的乘积 ...
cnp过滤周期。取值范围:0~255。 alp_shift alpha_shift,alpha桶更新周期的的偏移。取值范围:0~15。 返回值 0:成功 非0:失败 约束说明 该命令仅支持在物理机的root用户下运行。 使用样例 hccn_tool -i 0 -dcqcn -s alg_mode 0 f 5 g_shift 7 al 64 tkp 3 max_speed 200000 ai 100 tmp 6 alp ...
CNP是RoCE v2规范中定义的拥塞通知方式。 NP上的算法主要用于决定CNP报生成的频率,比如可以每收到一个ECN就反馈一个CNP,也可以规定50us内最多反馈一个CNP。 CNP是区分流的,对于每个流NP算法流程如下图: NP状态机 RP发送方网卡上的算法:这是DCQCN的重头戏。分为降速过程,升速过程,更新alpha三个部分。降速过程...
CNP是RoCE v2规范中定义的拥塞通知方式。 NP上的算法主要用于决定CNP报生成的频率,比如可以每收到一个ECN就反馈一个CNP,也可以规定50us内最多反馈一个CNP。 CNP是区分流的,对于每个流NP算法流程如下图: NP状态机 RP发送方网卡上的算法:这是DCQCN的重头戏。分为降速过程,升速过程,更新alpha三个部分。降速过程...
cnp过滤周期,单位:us。取值范围:0~255,默认值为10。 alp_shift alpha_shift,α初始值的偏移。取值范围:0~15,默认值为10。 max_des_shift 最大降速比例,取值范围:0~9,默认值为7。 控制每次降速可以达到的最大比例为1-(2max_des_shift/1024),如配置为9,则对应的最大降速比例为1/2。 max_des_shift减小...
CNP帧格式: 配置流控: QoS保证质量 主要是二层的PCP和三层的DSCP, 进行流分类, 保证服务质量 网卡接收缓冲区的细粒度控制 将RX Buffer切片, 比如8片, 进行更细粒度的优先级队列控制 其他 一键配置: 可通过脚本检测和配置, 用于管理 RoCE 部署的系统高性能网络接口配置的命令行实用程序, 参考:https://github.co...