目前,星河AI网络与昇腾处理器已在多个大型智算中心落地实践,包括互联网头部企业、运营商、金融及能源行业的客户。在某万卡集群项目中,华为成功部署了超过9000张NPU卡、数百台交换机和数十PB存储设备,构建起全球领先的AI训练平台。极致密码:能效、运营、生态协同 对于一个正在上升期的产业来说,性能是核心问题,但并不是全部
前面我们说到环保人士抵制AI数据中心,就是因为万卡集群的AI数据中心,浪费的水实在太多了。王超维谛技术热管理解决方案部高级经理:这其实就回到那个规模效应了,如果说咱们只是建一两个数据中心,比如就是像20兆瓦,或者甚至即使到100兆瓦都没事。但是如果进一步扩大,那个耗水量是非常巨大的,可能会对当地的地下水资源...
我们来揭秘一下万卡集群的数据中心到底是如何运作的,也非常荣幸邀请了专注于数据中心基础设施的公司维谛技术的多位专家一起来探讨,AI 爆发给数据中心的基础设施带来的挑战与机遇。 01 AI 时代数据中心面临的挑战 首先,我们先简单了解下,数据中心的组成结构。 从物理结构上来看,数据中心会划分成三个系统,主机房、供电...
小米公司作为公司的主要客户,必将大幅受益于小米万卡集群数据中心的建设和投入效应。 小米公司和大位科技的合作关系由来已久,也非常引人关注。 2024年12月3日,大位科技公告,全资子公司张北榕泰 与某互联网客户签署了《定制化数据中心综合技术服务采购框架协议》 。张北榕泰为该客户提供60MW定制化数据中心标准机房环境、...
在AI训练集群日益强大的背后,隐藏着一群不为人知的“兵部尚书”,它们就是数据中心的基础设施。随着AI模型对算力需求的激增,“兵部尚书”也面临前所未有的挑战:功率密度飙升、水资源消耗巨大、电能供应捉襟见肘、部署速度要求紧迫……为什么数据中心会如此耗水?电力系统如何制约了数据中心的升级?本期视频,我们一起来解...
进一步地,一个Spine-block由32个Spine交换机组成,每个Spine交换机全连接至所有ToR交换机,覆盖4个ToR-group,总计支持2048张GPU。最终,Core-pod通过Core交换机的64个端口连接两个Spine-block,实现高达4096张GPU的聚合能力。多个Core-pod通过Core交换机全互联,共同构建出超大规模的万卡级GPU集群。
在AI训练集群日益强大的背后,隐藏着一群不为人知的“兵部尚书”,它们就是数据中心的基础设施。随着AI模型对算力需求的激增,“兵部尚书”也面临前所未有的挑战:功率密度飙升、水资源消耗巨大、电能供应捉襟见肘、部署速度要求紧迫,那么问题来了,为什么数据中心会如此耗水?电力系统如何制约了数据中心的升级?为了快速部署...
通过三年主攻智算、需求拉动、以用促建,全国一体化算力网络甘肃枢纽节点庆阳数据中心集群建设取得重大突破,智算规模突破5万P。会上,还发布了全国一体化算力网络枢纽节点庆阳数据中心集群“绿电聚合”模式、算力互联网络传输专线(甘肃枢纽庆阳集群)通信能力发展指数、首个国产万卡推理集群建成等十项重大成果。根据大会...
2.产业链协同发展:万卡集群AI数据中心的建设涉及到芯片、服务器、网络设备、存储设备等多个产业链环节,这将促进产业链各环节之间的协同发展。例如,芯片厂商与服务器厂商的合作将更加紧密,共同研发适配智算数据中心的高性能服务器;网络设备厂商将与数据中心运营商合作,提供更优质的网络解决方案。这种产业链协同发展将提高...
在AI训练集群日益强大的背后,隐藏着一群不为人知的“兵部尚书”,它们就是数据中心的基础设施。随着AI模型对算力需求的激增,“兵部尚书”也面临前所未有的挑战:功率密度飙升、水资源消耗巨大、电能供应捉襟见肘、部署速度要求紧迫,那么问题来了,为什么数据中心会如此耗