财新传媒
公司 > TMT > 正文

AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》

2018年04月08日 14:25 来源于 财新网
可以听文章啦!
目前主流的AI应用多是通过大量人工标注的数据来训练,成本高昂。AI研究者希望打造好奇心驱动的AI来自我学习
伯克利团队设计了一个自我监督学习的人工智能(AI)模型,放入到日本经典游戏《超级马里奥兄弟》中,并关闭了游戏中的所有外在激励,比如踩死前进道路中的乌龟不会加分,撞击半空中的砖块也不会加分。这个特殊的马里奥完全由好奇心驱动。图/视觉中国

  【财新网】(记者 叶展旗 发自圣何塞)AlphaGo学棋三天胜人千年,诀窍是增强学习。简单地说,AlphaGo并不需要理解围棋,它每一步只追求极致的胜率,就像人类训练小狗捡东西一般:做对了奖励,做错了惩罚。但人类学习其实大多没有这么强的外界激励。

  “飞行学院的学生从上第一堂课,到成为飞行员。并不是每一次飞行都会有强烈的外界激励。”近日,加州大学伯克利分校的博士生Deepak Pathak在接受财新记者采访时表示,很多现实世界的场景,都只有很少的外界激励,甚至没有激励。在这种情况中,好奇心会扮演内在激励的角色,驱动人不断探索外部世界和学习技艺。

责任编辑:黄凯茜 | 版面编辑:邱楠添
推广

财新私房课
好课推荐
财新微信


热词推荐
雷洋案尸检 收官 历届中央政治常委 昆明火车站暴恐案 王晓东 tpp协议 去产能 吴晓灵 负利率 张进 商誉 国九条 去产能 人工心脏 丰城电厂事故