UEC 规范将超越传输层定义标准语义层、改进的低延迟交付机制以及一致的 AI 和 HPC API,并通过 UEC 传输协议实现这些 API 的标准、多供应商支持。 AI 和 HPC 的安全性 AI 训练和推理通常发生在需要作业隔离的托管网络中。此外,AI 模型越来越敏感且是有价值的商业资产。认识到这一点,UEC 传输在设计上结合了网络...
UET 拥塞控制包含以下重要特性,由端侧硬件和交换机配合完成,有效减小了尾部延迟。 ▣ **Incast管理。**它用于解决集合通信(Collective)中下行链路上的扇入问题。AI和HPC应用经常采用集合通信在多个节点之间同步信息,当多个发送者同时向一个接收者发送流量,就会产生Incast拥塞。 ▣ **速率调整加速。**现有的拥塞控制...
UET 拥塞控制包含以下重要特性,由端侧硬件和交换机配合完成,有效减小了尾部延迟。 Incast管理。它用于解决集合通信(Collective)中下行链路上的扇入问题。AI和HPC应用经常采用集合通信在多个节点之间同步信息,当多个发送者同时向一个接收者发送流量,就会产生Incast拥塞。 速率调整加速。现有的拥塞控制算法,在发生网络拥塞后...
现有的拥塞控制算法,在发生网络拥塞后调整速率的过程较长,而 UET 可以快速上升到线速。方法是测量端到端延迟来调节发送速率,以及根据接收方的能力通知发送方调整速率。 ▣基于遥测。源自网络的拥塞信息可以通告拥塞的位置和原因,缩短拥塞信令路径并向终端节点提供更多信息,从而实现响应速度更快的拥塞控制。 ▣基于包...
UEC Transport (UET) 通过提供多种创新来实现这一目标,这些创新可实现更高的网络利用率和更低的尾部延迟,这两者对于减少 AI 和 HPC 作业完成时间都至关重要。 随着AI模型和HPC工作负载规模不断增长,需要更大的集群,因此网络性能日益成为限制因素。此外,网络对功耗和总体 TCO 的贡献持续上升。对 UEC 网络技术的适...
2024年5月,AMD、Broadcom、Cisco、Google、HPE、Intel、Meta 和Microsoft达成一致,将制定一项新的行业标准,专用于推动数据中心用纵向扩展人工智能(AI)系统连接的高速低延迟通信。该初始小组将定义并建立一个开放的行业标准,称为超加速器链路 (UALink),...
UET协议将超越传输层,定义标准语义层、改进的低延迟交付机制以及一致的 AI 和 HPC API,并提供标准的多供应商支持,以便通过 UEC 传输协议实现这些 API。为了实现全行业在互操作性方面的合作,UEC构建了完整的基于以太网的通信堆栈架构,以最好地匹配快速发展的、大规模的AI/HPC工作负载,并提供一流的功能、性能、...
虽然人工智能(AI)工作负载往往对带宽需求很高,但高性能计算(HPC)也包括对延迟更敏感的工作负载,这两种要求都需要满足。为了满足这些需求,UEC确定了以下理想特性:灵活的传输顺序;现代拥塞控制机制;多路径和分组喷射;以及更大的可扩展性和端到端遥测。旧技术使用的刚性分组排序限制了效率,因为它阻止了乱序数据...
超以太网联盟(UEC)旨在创建一个“基于以太网的完整通信堆栈架构”,用超以太网传输协议取代基于以太网的RoCE协议,提高网络吞吐量、降低延迟,增强网络的可靠性和稳定性,为人工智能和高性能计算等领域的发展提供更加坚实的网络基础,同时保留以太网/IP生态系统的优势。
致力于提高物理性能,减少延迟,改善以太网物理基础设施的管理。包括以太网物理层规范、电气和光信号特性、应用程序接口和数据结构的开发。目标是使基础更加强大,确保以太网能够满足AI和HPC的严格要求。当前物理层工作组致力于100G/Lane和200G/Lane的PHY规范制定,已经确定了100G /Lane 介质类型、PHY支持的速率和类型。20...