财新传媒
公司 > 要闻 > 正文

GPT革命|智谱AI张鹏:500一600亿参数是大模型的门槛

文|财新 刘沛林
2023年04月04日 16:03
张鹏认为,AI2.0解决了人工智能通用性的问题,场景割裂的中、小模型意义不大
资料图:智谱AI创始人、CEO张鹏。

  【财新网】“如果不具备泛用性,尽管模型比以前大一点、效果好一点,应用场景仍然是割裂的,这些中小模型和原来有什么区别?” 主攻预训练大模型的智谱AI创始人、CEO张鹏近日接受财新专访时指出,他认为这一轮AI热潮建立在大模型的泛化能力上,业界普遍的认识是500一600亿参数是大模型智能涌现的门槛。

  张鹏指出,尽管适用于单场景的模型需要参数量、成本相对较低,但一旦应用于新行业所有训练数据需要重新来过,泛化能力低。他认为,大模型参数降下来很容易,同时还能保持很强的能力,但一个中模型、小模型提升则很困难。“像之前CV(计算机视觉)那些模型只做人脸识别,给一个宠物照片就傻了,大模型可以往下降维,但小模型没法往上升维,”他说。

  推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

责任编辑:屈运栩 | 版面编辑:边放
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅