GPT革命｜阿里云发布新一代开源模型称能力超过Llama3

文｜财新刘沛林

2024年06月07日 17:25

阿里云称，目前还在训练更大参数的模型，下一步还将发展多模型、多模态的能力

: 过去一年，阿里云是国内开源模型最积极的推动者。图：视觉中国

相关报道: 【财新周刊】财新周刊｜AI大模型开闭源之战; GPT革命｜腾讯混元发布开源文生图模型采用Sora相同架构; GPT革命｜阿里云CTO周靖人：开源大模型的价值毋庸置疑; GPT革命｜Meta发布新一代开源模型模型开闭源之争持续; GPT革命｜AI大模型开打价格战阿里跟进字节降价抢用户

　　【财新网】阿里开源大模型再迭代。6月7日，阿里云在开源社区上线了Qwen2系列模型，包含5亿、15亿、70亿、570亿、720亿，五个参数版本的模型，其中Qwen2-72B模型在多个测评榜单的成绩超过了Meta 4月发布的Llama3-70B模型，Qwen2-57B则为阿里云第二款混合专家模型（MoE），MoE架构在相同算力资源下性能更强，被认为是大模型技术趋势。

　　阿里云提供的数据显示，在考察常识能力、逻辑推理、数学能力的多个测评榜单中，Llama3-70B、法国大模型公司Mistral AI旗下的Mixtral-8x22B、阿里云2月发布的Qwen1.5-110B此前位于第一梯队，榜单得分各有胜负，此次发布的Qwen2-72B得分则全面领先上述三款模型。

　　推荐进入财新数据库，可随时查阅公司股价走势、结构人员变化等投资信息。

　　财新机器人产业指数(RII)已发布，点击了解行业动态

责任编辑：屈运栩 | 版面编辑：刘春辉

更多更快财经资讯请看财新一线

GPT革命｜阿里云发布新一代开源模型称能力超过Llama3

推荐阅读

图片推荐

视听推荐

编辑推荐

财新名家

视频

博客

最新文章

English - Caixin Global

In Depth: The Unfinished Transformation of China’s LGFVs

In Depth: From Skies to Shackles, HNA Founder Chen Feng Sentenced to 12 Years in Prison

U.S. Details Steep Port Fees on China-Linked Vessels Starting Oct. 14

The Shady Deals Behind a Veteran Banker’s Suspended Death Sentence

Dongfeng Spins Off EV Brand Voyah for Independent Hong Kong Listing

GPT革命｜阿里云发布新一代开源模型 称能力超过Llama3

推荐阅读

图片推荐

视听推荐

编辑推荐

最新文章

English - Caixin Global

GPT革命｜阿里云发布新一代开源模型称能力超过Llama3