找回密码
 立即注册
搜索
查看: 105|回复: 0
打印 上一主题 下一主题
收起左侧

[探索频道] AlphaGo虽能战胜人类却不会计时

[复制链接]

版主勋章 - 版主勋章

 成长值: 47010

灰铜v1_04绿金v1_01蓝铜v1_05蓝铜v2_05红铜v1_01紫铜v1_05绿铜v3_02灰金v1_05蓝银v1_05紫银v1_01绿金v3_01

跳转到指定楼层
楼主
 楼主| 发表于 2016-6-28 18:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
AlphaGo虽能战胜人类却不会计时:时间控制仍需人类干预

      

  谷歌DeepMind的人工智能围棋系统AlphaGo已成为全球最知名的深度学习技术应用案例。不过,帮助AlphaGo取得成功的某些代码仍来自人工程序员。

  今年3月,AlphaGo以4:1的比分击败了韩国围棋冠军李世石。根据此前的报道,AlphaGo自己与自己练习了几百万盘棋,从而掌握了围棋技巧。

  AlphaGo是DeepMind的两大神经网络之一。其技术包括监督学习(即研究人类棋手的棋谱),以及增强学习(自己与自己练习,并从中改进)。不过最新消息显示,有些东西AlphaGo无法通过学习去掌握。

  DeepMind研究总监索尔·格雷佩尔(Thore Graepel)表示,最终完成的AlphaGo系统非常善于发现,应当专注于棋盘的哪个区域。不过,AlphaGo并不擅长何时停止思考,完成落子。

  这带来了问题,因为顶级围棋赛事有着复杂的计时系统。例如,在与李世石的对局中,双方各有2小时的常规时间去落子,并在时间耗尽后有3次读秒机会。棋手可以选择在某一回合中启动读秒。但如果全部读秒时间耗尽,那么就会被判负。

  格雷佩尔表示:“人类能进行复杂的时间管理。在困难的局面下,他们会思考更长时间,而在简单的局面下,他们花的时间较少。我们试图让AlphaGo也能做到这点。”

  “时间是重要资源:我们思考某一步棋的时间越长,那么下法就可能越好。然而,时间是有限的。因此我们提出了一些方法,即如果算法在更长时间的思考后不会改变决策,那么我们可以探测出这点。”

  研究团队并未在AlphaGo的围棋知识中加入时间规则,而是引入了额外的限制。与核心引擎不同,时间算法是由人工设计的。

  不过,这仍完全基于算法。格雷佩尔表示:“通过评价系统,我们进行了优化。我们会比较不同的耗时曲线,例如在开始阶段用时较少,随后用时增多,或是开始用时较多,随后逐渐减少。我们测试了哪种方法效果最好。”

  因此,目前还不必担心机器抢走人类的工作,人类仍有工作要做,例如控制秒表。

插件设计:zasq.net

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋| ( Q群816270601 )

GMT+8, 2024-6-19 16:54 , Processed in 0.829659 second(s), 48 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表