【财新网】“如果类比语言模型,目前的视频生成有点像GPT-3左右的时代,距离到GPT-3.5版本的爆发点可能还有半年左右的时间,但应该不远了。”7月5日,新加坡南洋理工大学助理教授刘子纬在2024世界人工智能大会的视频生成前沿技术论坛上表示。
刘子纬主要研究计算机视觉、计算机图形学等,领导搭建了数个国际知名的基准数据库,例如CelebA和DeepFashion等。
2022年11月,OpenAI推出基于GPT-3.5模型的聊天应用ChatGPT,掀起全球新一波AI浪潮。2024年2月,OpenAI展示了名为Sora的文生视频模型,让视频生成领域迅速爆火。不过,半年过去,Sora依旧没有对外开放使用,其展示的视频被艺术团队披露包含大量人类后期特效,也让其惹上夸大宣传的争议。