【财新网】
零一万物回应“抄袭” 发布Yi-34B训练过程说明
11月15日,零一万物对其大模型Yi-34B训练过程进行说明,称训练模型过程中沿用了GPT/LLaMA的基本架构,且基本上国际主流大模型都是基于Transformer的架构,大模型持续发展与寻求突破口的核心点不仅在于架构,而是在于训练得到的参数。近日,Hugging Face开发者质疑李开复旗下 AI企业零一万物开源大模型抄袭了Meta的LLaMA架构,只对两个张量名称进行修改。零一万物开源团队总监Richard Lin称,在大量训练实验过程中,由于实验执行需求对代码做了更名,将尊重开源社区的反馈,将代码进行更新,也更好的融入Transformer生态。