财新传媒
公司 > 要闻 > 正文

GPT革命|Meta发布新一代开源模型 模型开闭源之争持续

文|财新 刘沛林
2024年04月19日 12:46
Meta称,还会在接下来数月的时间提供更强的长文本能力、多种尺寸、多语言的模型
北京时间4月19日凌晨,美国社交巨头Meta宣布推出Llama 3开源模型系列,将陆续登陆亚马逊AWS、Databricks、谷歌云、Hugging Face等大模型平台。

  【财新网】开源大模型的推手Meta发新一代模型。北京时间4月19日凌晨,美国社交巨头Meta(NASDAQ: META)宣布推出Llama 3开源模型系列,将陆续登陆亚马逊AWS、Databricks、谷歌云、Hugging Face等大模型平台。Meta称,还会在接下来数月的时间提供更强的长文本能力、多种尺寸、多语言的模型,目标是打造最好的基座模型。

  具体来看,此次发布的包括80亿、700亿参数的两个预训练语言模型,根据Meta的数据,在考察常识能力、学科知识、代码能力、数学能力的数据集榜单中,80亿参数的版本全面领先谷歌的轻量开源模型Gemma 7B–it,和欧洲大模型公司Mistral的开源模型Mistral 7B Instruct;700亿参数版本的整体得分小幅领先谷歌闭源模型Gemini Pro 1.5和Anthropic的闭源模型Claude 3 Sonnect。

  推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

责任编辑:屈运栩 | 版面编辑:刘潇
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅