首页 >

关于 >

新闻中心 >

公司新闻 >

阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载

阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载

发布时间

2025-07-28 10:31:57

作者:科技

分享:

【导语(yǔ)】7月(yuè)26日(rì),阶(jiē)跃(yuè)星(xīng)辰(chén)于上海正式发布新一代基础大模型Step 3,该模型将于7月31日向全球企业和开发者开源。作为阶跃星辰首个全尺寸、原生多模态推理模型,Step 3在模型架构与算法设计上实现创新,拥有321B总参数量,展现出强大的视觉感知与复杂推理能力。同时,Step 3针对广泛硬件平台进行优化,实现行业领先的推理解码效率,尤其在国产芯片上表现卓越。此外,阶跃星辰携手近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,推动AI与芯片技术的深度融合。

阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载

  7 月 26 日消息,在 2025 世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃(yuè)星(xīng)辰(chén)在上海正式发布了新一代基础大模型 ——Step 3,将于 7 月 31 日面向全球企业和开发者开源。

  据官方介绍,Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up。Step 3 采用 MoE 架构,总参数量 321B,激活参数量 38B

  Step 3 拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的(de)交(jiāo)叉(chā)分(fēn)析(xī),以(yǐ)及(jí)日(rì)常(cháng)生(shēng)活(huó)中(zhōng)的(de)各(gè)类(lèi)视(shì)觉(jué)分(fēn)析(xī)问(wèn)题(tí)。

  Step 3 在(zài) MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等(děng)榜(bǎng)单(dān)上(shàng)取(qǔ)得(de)了(le)开(kāi)源(yuán)多(duō)模(mó)态(tài)推(tuī)理(lǐ)模(mó)型(xíng)的(de) SOTA 成(chéng)绩(jī)。

  官(guān)方(fāng)称(chēng),目(mù)前(qián),主流(liú)开(kāi)源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。在架构设计阶段,Step 3 便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。凭借系统和架构创新,Step 3 实现了行业领先的推理解码效率。

  根据原理分析,Step 3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测 Step 3 相较于 DeepSeek-R1 的吞吐量提升超 70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的

  阶跃星辰宣布联合近 10 家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。


相关新闻

返回顶部