财新传媒
公司 > 要闻 > 正文

阿里发布新一代开源模型Qwen3 部署门槛大幅降低

文|财新 刘沛林
2025年04月29日 08:47
阿里巴巴称,新模型相较于DeepSeek-R1部署成本降低了65-75%
4月29日,阿里巴巴发布了新一代开源大模型系列Qwen3。图:视觉中国

  【财新网】开源大模型竞赛持续。4月29日,阿里巴巴发布了新一代开源大模型系列Qwen3,阿里巴巴称新模型总参数量仅为DeepSeek-R1的三分之一,部署门槛大幅降低,同时其性能优于DeepSeek-R1。用户可以通过阿里云的企业平台或通义App直接体验该模型,夸克也将接入Qwen3。

  Qwen3的旗舰模型采用混合专家(MoE)架构,从36T的数据量上训练而来,总参数量为235B,激活参数量为22B。作为对照,同样采用MoE架构的DeepSeek-V3在14.8T的数量上训练而来,总参数量为671B,激活参数量为37B。

  推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

责任编辑:屈运栩 | 版面编辑:王影
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅