财新传媒
财新传媒
1111111
财新通行证
T中

阿里发布新一代开源模型Qwen3 部署门槛大幅降低

文|财新 刘沛林
2025年04月29日 08:47
阿里巴巴称,新模型相较于DeepSeek-R1部署成本降低了65-75%
news 原图 4月29日,阿里巴巴发布了新一代开源大模型系列Qwen3。图:视觉中国

  【财新网】开源大模型竞赛持续。4月29日,阿里巴巴发布了新一代开源大模型系列Qwen3,阿里巴巴称新模型总参数量仅为DeepSeek-R1的三分之一,部署门槛大幅降低,同时其性能优于DeepSeek-R1。用户可以通过阿里云的企业平台或通义App直接体验该模型,夸克也将接入Qwen3。

  Qwen3的旗舰模型采用混合专家(MoE)架构,从36T的数据量上训练而来,总参数量为235B,激活参数量为22B。作为对照,同样采用MoE架构的DeepSeek-V3在14.8T的数量上训练而来,总参数量为671B,激活参数量为37B。

责任编辑:屈运栩 | 版面编辑:王影

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读

财新观察|用好用足市场准入负面清单

最新封面报道之二|美国金融监管转向

法眼|大同订婚强奸案维持原判 性同意的边界何在

新加坡执政班子换届后首迎大选 黄循财首战告捷稳住民意

小米高处不胜寒|特稿精选

财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>