财新传媒
公司 > 要闻 > 正文

GPT革命|智源发布多种大模型 称900卡可训万亿语言大模型

文|财新 刘沛林
2024年06月14日 15:47
统一的多模态大模型、具身智能大模型和科学用AI结合起来才能形成世界大模型,最终通向AGI
2024年6月14日,第六届“北京智源大会”在中关村展示中心开幕。图:智源研究院

  【财新网】由科技部、北京市支持的民营非营利机构智源研究院公布AI大模型最新进展。6月14日,智源研究院公布万亿参数的大语言模型进展,发布用于检索增强(RAG)的向量模型、采用自回归架构的多模态大模型、具身智能大模型和生物计算大模型,以及支持8种芯片的智算操作系统。

  具体来看,此次公布的万亿参数大模型“Tele-FLM“是和中国电信联合研发,中国电信主要提供算力和部分数据。智源研究院院长王仲远称,该项目是在112台A800机器(即896块A800 GPU)上训练4个月得出的,已开源发布的520亿参数版本英文能力优于Llama2-70B,接近Llama3-70B的水平,而中文能力优于Llama3-70B和Qwen1.5-72B。

  推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

责任编辑:屈运栩 | 版面编辑:李东昊
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅