财新传媒
财新传媒
1111111
财新通行证
T中

Meta开源最强多模态大模型Llama 4 实际表现受质疑

文|财新 杜知航
2025年04月07日 19:24
Llama 4最大模型的总参数将达2万亿
news 原图 自发布Llama3系列开源模型后,Facebook的母公司Meta在当地时间4月5日发布第一批Llama 4系列模型,包括大中小三个模型,首次使用了DeepSeek也在使用的混合专家架构(MoE)。

  【财新网】Llama系列开源大模型再升级,但具体表现受质疑。自发布Llama3系列开源模型后,Facebook的母公司Meta在当地时间4月5日发布第一批Llama 4系列模型,包括大中小三个模型,首次使用了DeepSeek也在使用的混合专家架构(MoE)。

  本次发布的模型为Scout(侦察兵)、Maverick(独行侠)和Behemoth(巨兽)。Llama 4 Scout拥有170亿活跃参数和16个专家,为多模态模型,总参数为1090亿。Meta称其性能超过了所有前几代的Llama模型,并且能够在一块NVIDIA H100 GPU上运行。此外,Llama 4 Scout提供了1000万上下文窗口,Meta称,在众多广泛报告的基准测试中,Llama 4 Scout表现优于Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1。

责任编辑:屈运栩 | 版面编辑:王影

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读
财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功

订阅财新网主编精选版电邮>>