财新传媒
公司 > 要闻 > 正文

GPT革命|视频生成技术路线尚未收敛 应用爆发仍需时间

文|财新 张而弛
2024年07月06日 11:30
AI视频生成工具还处在“宣传视频都很好,但实际一点都不好用”的阶段,很多公司的demo是在生成几百套视频以后,从中挑选出效果最好的呈现给用户,实际良品率较低,还无法量产
7月5日,2024世界人工智能大会的视频生成前沿技术论坛现场。图:世界人工智能大会公众号

  【财新网】“如果类比语言模型,目前的视频生成有点像GPT-3左右的时代,距离到GPT-3.5版本的爆发点可能还有半年左右的时间,但应该不远了。”7月5日,新加坡南洋理工大学助理教授刘子纬在2024世界人工智能大会的视频生成前沿技术论坛上表示。

  刘子纬主要研究计算机视觉、计算机图形学等,领导搭建了数个国际知名的基准数据库,例如CelebA和DeepFashion等。

  2022年11月,OpenAI推出基于GPT-3.5模型的聊天应用ChatGPT,掀起全球新一波AI浪潮。2024年2月,OpenAI展示了名为Sora的文生视频模型,让视频生成领域迅速爆火。不过,半年过去,Sora依旧没有对外开放使用,其展示的视频被艺术团队披露包含大量人类后期特效,也让其惹上夸大宣传的争议。

  推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

责任编辑:覃敏 | 版面编辑:王影
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅