首页 >

关于 >

新闻中心 >

公司新闻 >

阿里通义已开源200余个模型,千问3开创全球开源模型性能新高

阿里通义已开源200余个模型,千问3开创全球开源模型性能新高

发布时间

2025-05-02 09:01:29

作者:科技

分享:

【导语】今日凌晨,阿里巴巴正式开源了新一代通义千问模型Qwen3(简称“千问3”)。该模型采用混合专家(MoE)架构,总参数量高达235B,但激活仅需22B,性(xìng)能(néng)在(zài)推(tuī)理(lǐ)、指(zhǐ)令遵循、工具调用、多语言能力等方面均大幅提升,创下国产及全球开源模型新高。同时,千(qiān)问(wèn)3的(de)部(bù)署(shǔ)成(chéng)本(běn)大(dà)幅(fú)降低,仅需4张H20显卡即可部署满血版,显存占用仅为同类模型的三分之一。此外,千问3提供了多款模型版本,满足不同场景和性能需求,为智能体Agent和大模型应用爆发提供强大支持。全球开发者、研究机构和企业可免费下载并商用该模型,个人用户也可通过通义APP直接体验。阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,成为全球第一开源模型。

今日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称“千问3”)。

千问3采用混合专家(MoE)架构(gòu),总(zǒng)参(cān)数(shù)量(liàng)235B,激(jī)活(huó)仅(jǐn)需22B。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,创下所有国产模型及全球开源模型的性能新高。与此同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3性能图

千问3还提供了丰富的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斩获同尺寸开源模型SOTA(最佳性能):千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能。

并且,所有千问3模型都是混合推理模型,API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,灵活满足AI应用和不同场景对性能和成本的多样需求。比如,4B模型是手机端的绝佳尺(chǐ)寸(cùn),8B可(kě)在(zài)电(diàn)脑(nǎo)和(hé)汽(qì)车(chē)端(duān)侧丝滑部署应用,32B最受企业大规模部署欢迎,有条件的开发者也可轻松上手。

Qwen3开源模型家族

千问3为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中,千问3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,将大幅降低Agent调用工具的门槛。同时,千问3原生支持MCP协议,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent 框架,将大大降低编码复杂性,实现高效的手机及电脑Agent操作等任务。

据悉,千问3系列模型依旧采用宽松的Apache2.0协议开源,并首次支持119多种语言,全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用,个人用户也可以立即通过通义APP直接体验千问3。

据了解,阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,已超越美国Llama,成为全球第一开源模型。

相关新闻

返回顶部