【财新网】开源大模型竞赛持续。4月29日,阿里巴巴发布了新一代开源大模型系列Qwen3,阿里巴巴称新模型总参数量仅为DeepSeek-R1的三分之一,部署门槛大幅降低,同时其性能优于DeepSeek-R1。用户可以通过阿里云的企业平台或通义App直接体验该模型,夸克也将接入Qwen3。
Qwen3的旗舰模型采用混合专家(MoE)架构,从36T的数据量上训练而来,总参数量为235B,激活参数量为22B。作为对照,同样采用MoE架构的DeepSeek-V3在14.8T的数量上训练而来,总参数量为671B,激活参数量为37B。