首页 >

关于 >

新闻中心 >

公司新闻 >

华为推出昇腾超节点技术,成功实现业界最大规模 384 卡高速总线互联

华为推出昇腾超节点技术,成功实现业界最大规模 384 卡高速总线互联

发布时间

2025-05-26 09:31:22

作者:科技

分享:

【导语】2025年5月23日,华为在鲲鹏昇腾开发者大会上震撼发布昇腾超节点技术,成功实现了业界最大规模的384卡高速总线互联。该技术打破了传统服务器通信带宽的限制,通过创新的对等计算架构和高速总线互联,显著提升了AI模型训练的性能,为未来更大规模的模型演进提供了强有力的支撑。性能测试数据显示,昇腾超节点集群在多模态、MoE等模型上的性能提升显著,引领了AI计算架构的新一轮创新升级。

华为推出昇腾超节点技术,成功实现业界最大规模 384 卡高速总线互联

  2025 年 5 月 23 日,在鲲鹏昇腾开发者大会 2025 —— 昇腾 AI 开发者峰会上,华为推出了昇腾超节点技术,成功实现业界最大规模的 384 卡高速总线互联

  当前,大模型发展呈现参数与效率交替演进的态势:一方面,Scaling Law 不断推动模型能力突破极限;另一方面,以 DeepSeek 为代表的创新架构与工程技术,正加速模型能力在千行万业的落地应(yīng)用(yòng)。在(zài)此(cǐ)背(bèi)景(jǐng)下(xià),MoE 成(chéng)为(wèi)主流(liú)模(mó)型(xíng)结(jié)构(gòu),其(qí)复(fù)杂(zá)的(de)混(hùn)合(hé)并(bìng)行(xíng)策(cè)略(è)带(dài)来(lái)巨(jù)大(dà)挑(tiāo)战(zhàn),TP、SP、EP 单(dān)次(cì)通(tōng)信(xìn)量(liàng)高(gāo)达(dá) GB 级(jí)且(qiě)难(nán)以(yǐ)掩(yǎn)盖(gài)。随(suí)着(zhe)并(bìng)行(xíng)规(guī)模(mó)持(chí)续(xù)扩(kuò)大(dà),传(chuán)统(tǒng)服(fú)务(wu)器(qì)跨(kuà)机(jī)带(dài)宽(kuān)已(yǐ)成(chéng)为(wèi)训(xun)练(liàn)的(de)核(hé)心(xīn)阻(zǔ)碍(ài),亟(jí)需(xū)计(jì)算(suàn)架(jià)构(gòu)的(de)创(chuàng)新(xīn)升(shēng)级(jí)以(yǐ)适(shì)配(pèi)未(wèi)来(lái)模(mó)型(xíng)发(fā)展(zhǎn)。

  传(chuán)统(tǒng)服(fú)务(wu)器(qì)依(yī)赖(lài)以(yǐ)太(tài)网(wǎng)络(luò)实(shí)现(xiàn)跨(kuà)机(jī)互(hù)联(lián),通(tōng)信(xìn)带(dài)宽(kuān)较(jiào)低(dī)。实(shí)践(jiàn)表(biǎo)明(míng),当(dāng) TP、SP 或(huò) EP 等(děng)分(fēn)布(bù)式(shì)策(cè)略的混合并行域超过 8 卡时,跨机通信带宽便成为性能瓶颈,导致系统性能大幅下降。

  据介绍,华为昇腾超节点打破了以 CPU 为中心的冯诺依曼架构,创新提出了对等计算架构,凭借高速总线互联技术实现重大突破,把总线从服务器内部,扩展到整机柜、甚至跨机柜。在超节点范围内,用高速总线互联替代传统以太,通信带宽提升了 15 倍;单跳通信时延也从 2 微秒做到 200 纳秒,降低了 10 倍,使集群如同一台计算机般协同工作,有效突破系统性能限制。

  从华为中国官方获悉,此次推出的昇腾 384 超节点,由 12 个计算柜和 4 个总线柜构成,是目前业界规模最大的超节点。依托华为在 ICT 领域深厚的技术与工程经验,通过最佳负载均衡组网方案,该超节点可进一步扩展为包含数万卡的 Atlas 900 SuperCluster 超节点集群,为未来更大规模的模型演进提供支撑。

  性能测试数据显示,在昇腾超节点集群上,LLaMA 3 等千亿稠密模型性能相比传统集群提升 2.5 倍以上;在通信需求更高的 Qwen、DeepSeek 等多模态、MoE 模型上,性能提升可达 3 倍以上,较业界其他集群高出 1.2 倍,在行业中处于领先地位。

相关新闻

返回顶部