【财新网】真实数据价格高昂难获取,不同机器人本体的数据难复用,在技术远未收敛之时,具身智能大模型如何才能像大语言模型那样达到ChatGPT时刻?在3月29日的2025年中关村论坛上,多家机器人公司和机构讨论了人形机器人的通用泛化之路。
“数据其实是现在具身智能发展的一大瓶颈,”银河通用创始人王鹤指出,数据问题引发了学术界近两年激烈的讨论。他介绍,具身智能领域的数据基本可分为真实数据和仿真合成数据两大类别,真实数据当中又可细分,一类是互联网视频等无动作标签的数据,另一类是人来遥控机器人采集的数据,即遥操数据。互联网视频虽然大量存在,但是难以让机器人学习,就像难以通过看别人游泳来学游泳一样,而遥操数据很有价值,但获取成本很高。