财新传媒
公司 > TMT > 正文

AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》

2018年04月08日 14:25 来源于 财新网
可以听文章啦!
目前主流的AI应用多是通过大量人工标注的数据来训练,成本高昂。AI研究者希望打造好奇心驱动的AI来自我学习
伯克利团队设计了一个自我监督学习的人工智能(AI)模型,放入到日本经典游戏《超级马里奥兄弟》中,并关闭了游戏中的所有外在激励,比如踩死前进道路中的乌龟不会加分,撞击半空中的砖块也不会加分。这个特殊的马里奥完全由好奇心驱动。图/视觉中国

  【财新网】(记者 叶展旗 发自圣何塞)AlphaGo学棋三天胜人千年,诀窍是增强学习。简单地说,AlphaGo并不需要理解围棋,它每一步只追求极致的胜率,就像人类训练小狗捡东西一般:做对了奖励,做错了惩罚。但人类学习其实大多没有这么强的外界激励。

  “飞行学院的学生从上第一堂课,到成为飞行员。并不是每一次飞行都会有强烈的外界激励。”近日,加州大学伯克利分校的博士生Deepak Pathak在接受财新记者采访时表示,很多现实世界的场景,都只有很少的外界激励,甚至没有激励。在这种情况中,好奇心会扮演内在激励的角色,驱动人不断探索外部世界和学习技艺。

责任编辑:黄凯茜 | 版面编辑:邱楠添
推广

财新网主编精选版电邮 样例
财新网新闻版电邮全新升级!财新网主编精心编写,每个工作日定时投递,篇篇重磅,可信可引。
订阅