财新传媒
公司 > 要闻 > 正文

GPT周报|零一万物回应“抄袭”;英伟达新AI芯片2024年上市;微软自研AI芯片亮相

2023年11月17日 18:43
推荐:Sam Altman投资公司发布可穿戴AI硬件;WPS AI开启公测;比尔·盖茨称AI将彻底改变如何使用电脑
近日,Hugging Face开发者质疑李开复旗下 AI企业零一万物开源大模型抄袭了Meta的LLaMA架构,只对两个张量名称进行修改。图:财新

  【财新网】

  零一万物回应“抄袭” 发布Yi-34B训练过程说明

  11月15日,零一万物对其大模型Yi-34B训练过程进行说明,称训练模型过程中沿用了GPT/LLaMA的基本架构,且基本上国际主流大模型都是基于Transformer的架构,大模型持续发展与寻求突破口的核心点不仅在于架构,而是在于训练得到的参数。近日,Hugging Face开发者质疑李开复旗下 AI企业零一万物开源大模型抄袭了Meta的LLaMA架构,只对两个张量名称进行修改。零一万物开源团队总监Richard Lin称,在大量训练实验过程中,由于实验执行需求对代码做了更名,将尊重开源社区的反馈,将代码进行更新,也更好的融入Transformer生态。

  推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

责任编辑:张而弛 | 版面编辑:王影
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅