财新传媒
公司 > 要闻 > 正文

Meta开源最强多模态大模型Llama 4 实际表现受质疑

文|财新 杜知航
2025年04月07日 19:24
Llama 4最大模型的总参数将达2万亿
自发布Llama3系列开源模型后,Facebook的母公司Meta在当地时间4月5日发布第一批Llama 4系列模型,包括大中小三个模型,首次使用了DeepSeek也在使用的混合专家架构(MoE)。

  【财新网】Llama系列开源大模型再升级,但具体表现受质疑。自发布Llama3系列开源模型后,Facebook的母公司Meta在当地时间4月5日发布第一批Llama 4系列模型,包括大中小三个模型,首次使用了DeepSeek也在使用的混合专家架构(MoE)。

  本次发布的模型为Scout(侦察兵)、Maverick(独行侠)和Behemoth(巨兽)。Llama 4 Scout拥有170亿活跃参数和16个专家,为多模态模型,总参数为1090亿。Meta称其性能超过了所有前几代的Llama模型,并且能够在一块NVIDIA H100 GPU上运行。此外,Llama 4 Scout提供了1000万上下文窗口,Meta称,在众多广泛报告的基准测试中,Llama 4 Scout表现优于Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1。

  推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

责任编辑:屈运栩 | 版面编辑:王影
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅