网卡配置异常:进入协商过程后需要使用Host网卡,如果指定Host网卡和端口有问题,也会导致失败。网卡配置错误、端口被抢占是引起这个阶段失败的常见原因(具体配置方式请参见HCCL_IF_IP、HCCL_IF_BASE_PORT、HCCL_SOCKET_IFNAME等环境变量)。 网络异常:网络异常比如某些节点和Root Rank所在节点的Host网卡连通性也可能存在问...
export HCCL_SOCKET_IFNAME==eth*,enp*** # 使用指定的eth*或enp**网卡 export HCCL_SOCKET_IFNAME=^=eth*,enp*** # 不使用指定的eth*或enp**网卡 # 模糊匹配网卡 export HCCL_SOCKET_IFNAME=eth,enp # 使用所有以eth或enp为前缀的网卡 export HCCL_SOCKET_IFNAME=^eth,enp # 不使用任何以eth或enp...
export HCCL_SOCKET_IFNAME=eth,enp # 使用所有以eth或enp为前缀的网卡,比如eth1,eth2,enp1… export HCCL_SOCKET_IFNAME==eth*,enp*** # 使用指定的eth*或enp**网卡 export HCCL_SOCKET_IFNAME=^eth,enp # 不使用任何以eth或enp为前缀的网卡 export HCCL_SOCKET_IFNAME=^=eth*,enp*** # 不使用指...
•CM_WORKER_IP:用于配置当前节点与Master进行通信时所用的网卡IP,可通过ifconfig命令查询,要求为常规IPv4或IPv6格式。 需要确保指定的网卡IP能够与Master节点正常通信。 •HCCL_SOCKET_FAMILY:此环境变量可选,用于控制Device侧通信网卡使用的IP协议版本。AF_INET代表使用IPv4协议,AF_INET6代表使用IPv6协议,缺省时,...
SetIfName HcclNetwork 简介 HcclNetInit HcclNetDeInit HcclNetOpenDev HcclNetCloseDev HcclNetDevGetNicType HcclNetDevGetLocalIp HcclSocket 简介 HcclSocket ~HcclSocket Init DeInit Listen Connect Close SetStatus GetStatus Accept Send Recv ISend IRecv AddWhiteList DelWhiteList GetTag GetSocketType GetRemo...
SetIfName HcclNetwork 简介 HcclNetInit HcclNetDeInit HcclNetOpenDev HcclNetCloseDev HcclNetDevGetNicType HcclNetDevGetLocalIp HcclSocket 简介 HcclSocket ~HcclSocket Init DeInit Listen Connect Close SetStatus GetStatus Accept Send Recv ISend IRecv AddWhiteList DelWhiteList GetTag GetSocketType GetRemo...
SetIfName HcclNetwork HcclNetInit HcclNetDeInit HcclNetOpenDev HcclNetCloseDev HcclNetDevGetNicType HcclNetDevGetLocalIp HcclSocket HcclSocket ~HcclSocket Init DeInit Listen Connect Close SetStatus GetStatus Accept Send Recv ISend IRecv AddWhiteList DelWhiteList GetTag GetSocketType GetRemoteIp GetRe...
SetIfName HcclNetwork 简介 HcclNetInit HcclNetDeInit HcclNetOpenDev HcclNetCloseDev HcclNetDevGetNicType HcclNetDevGetLocalIp HcclSocket 简介 HcclSocket ~HcclSocket Init DeInit Listen Connect Close SetStatus GetStatus Accept Send Recv ISend IRecv AddWhiteList DelWhiteList GetTag GetSocketType...
{INSTALL_DIR}/lib64 export HCCL_SOCKET_FAMILY=AF_INET##多机多卡需要 export HCCL_SOCKET_IFNAME=eth,enp##多机多卡需要 #编译算子: cd ${INSTALL_DIR}/tools/hccl_test make MPI_HOME=/usr/local/mpich-3.2.1 ASCEND_DIR=${INSTALL_DIR} #测试总结: cd ${INSTALL_DIR}/tools/hccl_test ##单机...