【财新网】Llama系列开源大模型再升级,但具体表现受质疑。自发布Llama3系列开源模型后,Facebook的母公司Meta在当地时间4月5日发布第一批Llama 4系列模型,包括大中小三个模型,首次使用了DeepSeek也在使用的混合专家架构(MoE)。
本次发布的模型为Scout(侦察兵)、Maverick(独行侠)和Behemoth(巨兽)。Llama 4 Scout拥有170亿活跃参数和16个专家,为多模态模型,总参数为1090亿。Meta称其性能超过了所有前几代的Llama模型,并且能够在一块NVIDIA H100 GPU上运行。此外,Llama 4 Scout提供了1000万上下文窗口,Meta称,在众多广泛报告的基准测试中,Llama 4 Scout表现优于Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1。