上海国兆电子科技有限公司 全渠道O2O整合打造门店盈利新格局

【GMEGA分享】热点:新AlphaGo的突破

10月19日,谷歌旗下DeepMind团队发表了人工智能程序AlphaGo的最新研究成果,最新版本被命名为AlphaGo Zero的人工智能程序水平已经大大提升,超过了之前所有版本的AlphaGo。在与过往版本的AlphaGo对战中,AlphaGo Zero以100:0的成绩战胜了曾经赢下韩国棋手李世石那版AlphaGo。这项研究成果被发表在《自然》杂志上。

今年5月,AlphaGo也曾经以3:0的成绩战胜中国顶级围棋选手柯洁。在这一成果发表后,柯洁感叹:一个纯净、纯粹自我学习的AlphaGo是最强的,对于AlphaGo的自我进步来讲,人类太多余了。柯洁的感叹还不仅来自人与人工智能的差距,而更多的是人工智能可以进一步减少对人类经验的依赖,进行自我学习和探索。

AlphaGo之父、DeepMind联合创始人兼CEO德米斯·哈萨比斯(Demis Hassabis)介绍说:“AlphaGo Zero提高了计算效率,并且没有使用到任何人类围棋数据。”AlphaGo此前的版本,在训练中学习了大量人类围棋比赛的数据,而AlphaGo Zero则在一开始就不接触人类棋谱,研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。也就是说它能穷尽更多的可能性,而不只局限于人类已经走过的路。 通俗地说,AlphaGo Zero就是从一张白纸的零基础开始学习,“自学成才”,在3天时间内,进行500万盘的自我博弈,不断掌握招式,最终战胜了人工智能对手。而且随着训练的深入,DeepMind团队发现,AlphaGo Zero还走出了人类过往招式之外的新策略,为围棋这个游戏带来了新的见解。

哈萨比斯说:“最终,我们想要利用它的算法突破,去帮助解决各种紧迫的现实世界问题,如蛋白质折叠或设计新材料。如果我们通过AlphaGo可以在这些问题上取得进展,那么它就有潜力推动人们理解生命,并以积极的方式影响我们的生活。”下围棋并不是AlphaGo的最终目标,DeepMind团队希望能基于AlphaGo来打造通用的、探索人类和宇宙奥秘的工具。

【GMEGA观点】围棋作为一种完全信息零和博弈,理论上是可以通过穷举搜索来找到最优解,把人类下棋思考化为两个简单的决策模型,落子策略和评估胜率。再结合蒙特卡罗树搜索算法,从而大幅降低搜索的空间,实现有限计算量下逼近最优解,但人腦算不出这么大的工作量,所以通过计算机概率采样的方式来操作,而AlphaGo Zero的零功能自我学习,能根据深度神经网络系统实现,抛开之前的所有经验,却令我有股毛骨悚然的感觉,艾隆马斯克一直在强调人工智能可能带来的危害,火药的发明,也许推动了时代的进步,但相同的也带来了战争。

GMEGA地图2.png

Z)({$%ZPK$([()5T45%JJJE.png