English
联系我们
网站地图
邮箱
旧版回顾



蚂蚁大乐透倍投算法大赛官网

谷歌大乐透倍投算法如何连赢人类围棋冠军5局,如何评价它?

一石激起千层浪。当大乐透倍投算法战胜人类……这个原本看似遥远的事情真正的发生了,在2015年10月5日,全程没有让棋。

1月28日,《金融时报》援引《自然》杂志的报道,由谷歌伦敦子公司DeepMind开发的AlphaGo机器,以5:0的战绩击败了欧洲围棋三届冠军樊麾(出生于中国,现籍法国)。DeepMind是2014年被Google以4亿英镑的价格收购的大乐透倍投算法团队。

在1月27日,DeepMind团队发表的《Mastering the game of Go with deep neural networks and tree search》作为《自然》(Nature)封面论文上线。团队创始人Demis Hassabis表示,他们开发的围棋程序AlphaGo融合了高级树状查找和深度神经网络。

同一天,Google在官方博客中表示:“我们很骄傲地公告天下,我们的科学家已经搞定了围棋,并攻克了大乐透倍投算法领域的一项重大挑战。”

今年3月,AlphaGo将在首尔与过去十年全世界最顶级的围棋选手李世石对决。

谷歌AlphaGo是怎么赢的?——双大脑工作

通过对神经网络进行的3000万步训练 (所有棋谱均来自人类专业棋手的比赛),AlphaGo预测出人类对手下一步走法的正确率已经达到了57%,之前的纪录是44%。

AlphaGo使用两个不同的神经网络“大脑”,通过两者合作得出移棋决定。

根据微信公众号《大乐透倍投算法学家》对上述论文的编译得知,AlphaGo的两个大脑分工如下:

大脑1:“监督学习(SL)政策网络”。着眼于棋盘中的位置,并试图决定最佳的下一步。实际上,它用来估计每个合法下一步行动为最好的一步的可能性,其顶层猜测就是具有最高概率的那步。该团队通过几百万个优秀的人类棋手在KGS上的下棋选择,训练这个大脑,其目的仅仅是复制优秀的人类棋手的移动选择。它一点也不关心赢得比赛,只下那步顶级人类棋手会下的那步棋。 AlphaGo的下棋选择器有57%的概率可以正确匹配优秀的棋手下棋选择。

大脑2:“价值网络”。它不猜测具体的下一步怎么走,而是通过设想的棋盘分布,估计每个玩家赢得比赛的概率。它通过提供整体的位置判断来配合“监督学习(SL)政策网络”。这个判断只是近似的,但它对加快阅读速度非常有用。通过将未来可能的位置分为“好”或“坏”的分类,AlphaGo可以决定是否要沿着一个特定的变化进行更深的阅读。如果位置评估器说某个具体的变化看起来情况不妙,那么AI可以跳过阅读,不沿着那条线继续发挥。

据论文介绍,当只使用一个大脑时,AlphaGo大概和目前最好的电脑围棋AI实力相当,但结合两个大脑是,它可能达到人类职业棋手的水平。

专业围棋手是怎么看的?

2013-2015年三度欧洲围棋冠军樊麾,也是本次人机大战的主角之一,他表示:

在中国,围棋不仅是一项比赛,它还是生活的一面镜子。我们说,假如你的棋下得有问题,那很可能是你心性的问题——棋如其人。

输棋确实很难过。和AlphaGo对战之前,我觉得我能赢。在第一局失利后,我改变了战术,增强了进攻,但还是输了。问题是人类有时会犯致命的错误,因为我们是人。有时我们会疲惫,有时我们求胜心切,我们总有这样那样的压力。电脑程序不会这样,它非常强,也非常稳定,简直就像一堵墙一样。对我来说这是很大的差别。我知道AlphaGo是个电脑,但如果没人告诉的话,我可能会觉得它是个有点陌生却又非常强大的对手,是个真人。

当然,输掉比赛让我不太开心,不过作为职业选手,我们输过很多比赛。所以,失败了就从中学习,也许会有所收获。总之从长远来讲这是一件好事。

随后在一个微信群里,樊麾说:“一切都是真的,因为一直在保密中,所以大家都不知道。我没有放水,不过下得确实不好。只能告诉大家,这个系统确实很强!拭目以待和李世石的棋吧!这是去年10月下的,还有些条款在保密范围之内的,我不能告诉大家,不过我觉得跟李世石的棋会很精彩!”

曹大元九段:昨晚就看到了,所以睡不着觉了,压力很大啊!

孟泰龄:我认为樊麾布局有三盘占优,另两盘劣势。我觉得电脑确实有职业水准。感觉电脑棋风稳健,酷爱实地,如果后半盘它真的可以滴水不漏的话,那距离顶尖真的只有一层窗户纸的距离了。显然电脑大局观差一些,但局部棋型的感觉及计算已经有相当水准了。

业内人士怎么看?

DeepMind创始人Demis Hassabis:

AlphaGo正在突飞猛进,甚至会超越最棒的人类选手。能够看它在围棋规则内去创造新的东西,感觉很神奇。我们对自己创造的这个系统有种很密切的感情,特别是它被创造的方式——它会学习,我们也会教它,它的风格就像人一样。和其他编出来的程序不同,你不知道它到底都会什么,因为它能够自己学习。

阿尔伯塔大学计算机科学家、Chinook设计师 Jonathan Schaeffer:

我想这还不是围棋版的深蓝时刻。真正的成就是这个程序能作为选手在顶级比赛中较量的时候。深蓝从1989年开始就常常战胜各路大师,最后登顶则是八年之后的事情。但就目前情况来看,我认为AlphaGo和顶级人类选手之间的差距被大大缩短了。可能只需要再进行一点努力和改善,再提高一点计算能力,不出一两年,它就能打败人类。

就今年3月份的比赛来说,不是打击AlphaGo团队,我还是看好人类。我们可以把AlphaGo看成是少年天才。它突然学了一手好棋,进步神速,但毕竟还是经验有限。从国际象棋和西洋跳棋来看,经验还是很重要的。

国际围棋联合会秘书长Hajin Lee:

当我知道那个电脑要挑战职业顶尖棋手李世石的时候,真的很吃惊。我当时觉得这个挑战者绝对对顶级选手有多强完全没概念。但实际上,可能我才是那个不知道这个电脑有多强的人。现在我对这个比赛非常兴奋。

谁会赢呢?我不知道。李世石自己也觉得可能那电脑跟他一样强。可能是我听到了太多AlphaGo的消息,我现在惊讶于它的强大。同时我也非常了解李世石的水平,所以我认为他们双方五五开吧。

我觉得围棋是个很有内涵的竞技,我不觉得如果电脑AI击败了人类会对围棋造成什么伤害。我想人们会接受自己被电脑技术超越这件事。

最后,让我们通过下面五张GIF图回顾一下这五局棋,樊麾是怎么输给谷歌AlphaGo机器的(来自微信公众号:棋文弈事):

第一局

第二局

di er ju

第三局

第四局第五局

本文参考了微信公众号:大乐透倍投算法学家、棋文弈事,以及参考消息、雷锋网等网站的相关报道。

当前文章:http://www.xthtjfls.com/iblvib33/14123-17379-48643.html

发布时间:00:38:48


{相关文章}

深度学习必将再一次把大数据带至风头浪尖

  2016年,马云提出了未来的五个新思想,即新零售、新制造、新金融、新资源、新技术,它们将会影响每一个人并构筑一个新的世界。今年,轮到百度发声了,李彦宏提出了四个时代:内容分发、连接服务、金融创新、大乐透倍投算法。李彦宏说,互联网的下一幕就是大乐透倍投算法的时代,大乐透倍投算法会改变每一个行业。

soso_tc_slider_img

  你如何看待大乐透倍投算法_星玄未来大乐透倍投算法平台深度学习必将再一次把大数据带至风头浪尖说起大乐透倍投算法不得不提去年AlphaGo打败了世界围棋冠军李世石,而在媒体描述AlphaGo胜利的时候,将大乐透倍投算法、机器学习和深度学习都用上了,大乐透倍投算法设计工程师_星玄未来大乐透倍投算法平台这三者在AlphaGo击败李世石的过程中都起了作用,但它们究竟是什么关系?下面赛智时代就先给大家做一点简单的科普:

  正如下图所示,三者属于在一个同心圆内的包含关系,大乐透倍投算法技术最先出现,典型应用是可以与人下国际跳棋,大乐透倍投算法为机器赋予了人的智能;接下来就是机器学习技术,使用算法来解析数据并从中学习,对真实世界中的事件做出决策和预测,最成功的应用领域是计算机视觉,机器学习为大乐透倍投算法提大乐透倍投算法调查报告ppt模板_星玄未来大乐透倍投算法平台供了实现的方法;最后的深度学习技术,其实就是早期的人工神经网络(机器学2018亚太大乐透倍投算法峰会_星玄未来大乐透倍投算法平台习中的一机器人智能vs大乐透倍投算法_星玄未来大乐透倍投算法平台个重要算法)进化而来,首次公开展示就是从YouTube视频里找到猫的图片,深度学习是实现机器学习的一种技术。那如何才能区分机器学习与深度学习呢?

soso_tc_slider_img

  深度学习必将再一次把大数据带至风头浪尖传统机器学习和深度学习算法的主要区别在于特征。如下图所示,在传统的机器学习算法中,我们需要手工编码特征。相比之下,在深度学习算法中,特征由文科女生可以学那个大乐透倍投算法吗_星玄未来大乐透倍投算法平台算法自动完成,这个过程不仅耗时,而且还需要很专业的相关知识才能完成。与具有较少或没有特征工程的传统机器学习相比,深度学习目标是更准确做到机器学习算法。

  责任编辑:null

?上一页1??2 下一页

专题推荐

相关新闻


? 1996 - 星玄未来大乐透倍投算法平台 版权所有?? 联系我们

地址:北京市三里河路52号 邮编:100864