财新传媒
公司 > 要闻 > 正文

GPT革命|谷歌推2代AI机器人 能听话会学习

文|财新 杜知航,祝宇欢(实习)
2023年07月31日 20:20
RT-2能理解自然语言,能识别物体,还能进行逻辑判断,做出合理的动作
谷歌近日推出AI机器人模型Robotics Transformer 2(RT-2),作为视觉-语言-动作(vision-language-action,VLA)模型,RT-2配备了大语言模型技术,直接从互联网学习知识,可以识别物体、理解语言命令,然后做出有逻辑的动作。图:谷歌DeepMind

  【财新网】机器人AI引入大语言模型,即使遇到见过的新情况,也能理解。谷歌近日推出AI机器人模型Robotics Transformer 2(RT-2),作为视觉-语言-动作(vision-language-action,VLA)模型,RT-2配备了大语言模型技术,直接从互联网学习知识,可以识别物体、理解语言命令,然后做出有逻辑的动作。

  RT-2主要有三种能力:符号理解(Symbol understanding)、推理(Reasoning)和人类识别(Human recognition),依靠这些能力,机器人可以理解“捡起即将从桌子上掉下来的袋子”或“把香蕉移到2加1的和的标志那里”这样的命令——其中的物体或场景是原有机器人数据中从未有过的,机器人模型使用了互联网的知识,最后完成操作。

  推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

责任编辑:屈运栩 | 版面编辑:王影
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅