【财新网】智源研究院正式公布统一模态模型进展。10月21日,由科技部、北京市支持的民营非营利机构智源研究院发布了采用了自回归(autoregressive)技术路线的多模态模型“Emu3”,同步上线开源社区供产业界进一步探索。
自回归模型根据之前输入的变量来预测下一个变量,是OpenAI推出的GPT系列语言大模型底层技术路径,目前市面上大多数多模态大模型App是集成了不同架构的语言、文生图、视频模型,模型的训练、推理亦相互独立。仅有OpenAI今年5月发布的GPT-4o、国内私募机构幻方量化旗下DeepSeek 10月发布的Janus等少数模型开始了该路线做多模态的探索,但尚未涉及文生视频。