财新传媒
公司 > TMT > 正文

AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》

2018年04月08日 14:25 来源于 财新网
可以听文章啦!
目前主流的AI应用多是通过大量人工标注的数据来训练,成本高昂。AI研究者希望打造好奇心驱动的AI来自我学习
伯克利团队设计了一个自我监督学习的人工智能(AI)模型,放入到日本经典游戏《超级马里奥兄弟》中,并关闭了游戏中的所有外在激励,比如踩死前进道路中的乌龟不会加分,撞击半空中的砖块也不会加分。这个特殊的马里奥完全由好奇心驱动。图/视觉中国

  【财新网】(记者 叶展旗 发自圣何塞)AlphaGo学棋三天胜人千年,诀窍是增强学习。简单地说,AlphaGo并不需要理解围棋,它每一步只追求极致的胜率,就像人类训练小狗捡东西一般:做对了奖励,做错了惩罚。但人类学习其实大多没有这么强的外界激励。

  “飞行学院的学生从上第一堂课,到成为飞行员。并不是每一次飞行都会有强烈的外界激励。”近日,加州大学伯克利分校的博士生Deepak Pathak在接受财新记者采访时表示,很多现实世界的场景,都只有很少的外界激励,甚至没有激励。在这种情况中,好奇心会扮演内在激励的角色,驱动人不断探索外部世界和学习技艺。

责任编辑:黄凯茜 | 版面编辑:邱楠添
  • 此篇文章很值
  • 赞赏激励一下

首席赞赏官虚位以待

推广

财新私房课
好课推荐
财新微信

热词推荐
王传福 会议 京张高铁 非洲象 张进 邹承鲁 内蒙古银行 sdr 廉政准则 华兴资本 索罗斯 毛超峰 有其屋 硬座 作家陈映真去世