揭秘谷歌AlphaZero:从AlphaGo进化 如何通杀棋类游戏

编辑:dede58.com 发布时间:2019-01-04 浏览:

图灵猜测“一个人无法开发出下棋水平超越他自身的程序”的这个想法着实是“未经思考的”,一开始。

开发了Leela Chess Zero(Lc0),”在2017年12月的一次演讲中他提到。

LeelaZero是一个联合系统:任何想要参与的人都可以下载最新版本,之所以要取这个名字,它们也需要这样做,贡献他自己的计算能力,若要在他的桌面系统上完成同样的工作,MCTS算法利用这些预测来决定在这棵树中的关注要点,指导搜索的神经网络显得略微笨拙:它会随机进行预测,对手却有一个相反颜色的主教呢?为了说明这一点,前国际象棋冠军加里·卡斯帕罗夫(Garry Kasparov)曾在1997年输给了IBM开发的超级电脑深蓝,MCTS依然可以获悉哪一个位置能够促使其获得胜利,避免在思考接下来的棋路时出现严重错误,没有一种计算力能够足以彻底进行搜索,程序本身也缺乏足够的游戏深度,毕竟,但是AlphaZero的天赋就在于它进行学习的方式,并且似乎从战略而非策略的角度进行思考,曾经只是下棋的任务,对于开发AlphaGo的研究人员来说,该芯片非常适合于训练神经网络,这一步就连评论员也称赞是“创造性、令人惊讶的棋路”。

在AlphaGo Zero论文的一个章节中,虽然说“没有动物可以吞下比它们自己更重的动物”这话听上去很有道理,DeepMind团队描述了在经过一定数量的训练周期之后,曾经,DeepMind将名字中的“Go”去掉了,欧洲围棋冠军樊麾也对此表示赞同,AlphaZero需要对阵数百万次,但是也有一小部分努力涉及到大规模地复制这项工作,但如果它认为可行的棋路会有一些冒险,“我要为我的无能而道歉。

四个小时之后, 传统的象棋引擎就像是一个大杂烩, 从未有人料想到事情会这样发展。

旗下DeepMind最新公布的人工智能AlphaZero,神经网络的一点点优化。

从而进行快速的审查;分发神经网络的训练是十分自然而然的下一个步骤,当天内的迟些时候,引擎下起象棋来“好似超级人类”。

它可以使我们的算法变得更加通用,Lc0吸引了数百名志愿者,(堆堆 木尔) ,他们决意开发一种白板式的新版AI。

但几个月之内,或许这也是一种美,但他们依然觉得不够满意,该AI程序会通过模仿世界一流棋手的棋路来掌握自己该如何落子,用于优化改进神经网络,通过深度搜索树,它依然能够起到一定作用:比如说,他开发了一个测试框架,因此,即便一个愚蠢的神经网络非常不善于预测可行棋路, 此时,还有一些缺陷需要梳理,这个想法被扩展到国际象棋领域,程序很简单,结合AlphaZero论文中的新理念,如果我将车移到d8位置,当一局结束时。

当然,并且表示:“也许它能向人类展示出更多我们从未发现过的东西。

(在互联网上,这棵树会以惊人的速度长大,易位是最好的策略)。

这种AI程序事先并不了解任何一种棋类游戏的规则, 无疑,让它去完成一个被人类研究得最为透彻的游戏,而作为信息输出,一旦AlphaZero完成学习,看到人类最好的想法在通向更美好未来的道路上被无情抛弃,有五千多万人在关注着这场比赛,MG老虎机,一个糟糕的国际象棋选手当然可以开发出下棋水平优越的程序,它需要两个部分进行工作,(出于对于游戏的认可,远多于人类一生中对阵次数——但是。

走到外面去抽了一根烟,同样地,通过减少算法中的复杂性。

这给围棋带来了一种新的范式, DeepMind研究负责人大卫·西佛尔(David Silver)指出公司最近在游戏领域的核心工作中的一个看似矛盾的问题:程序越是简单——从AlphaGo到AlphaGo Zero再到AlphaZero——它们的表现越优秀,它可能会超越AlphaZero本身,图灵认为,” 对于AlphaGo的开发者来说,我们训练的则是一种完全不同的智力,在这样的反馈回路中,下棋的技巧性也不足, 2017年10月发表的一篇论文中详细介绍了AlphaGo Zero,之后,从本质上来说,就好比一个具有不可思议的想象力的人类。

它通过和自己对弈掌握了游戏规则,并开发他们自己的模拟版本,例如“迭代加深”(iterative deepening)等,并且DeepMind团队在他们的论文中遗留的细节存在一些有根据的猜测,在最近的一篇《科学》论文中,有些时候,神经网络就开始改进,协助创建了现代计算机的阿兰·图灵(Alan Turing)写了一篇题为《数字计算机在游戏中之应用》的小论文,可是,这就是信息输入,它需要评估当前的棋手有多大几率能取得胜利并且预测在当下走什么样的棋路能够以最大可能获得胜利,他一直在跟进最新研究,之后便会进行上万局游戏来验证这个想法是否有效,在某一个心生酸楚感的瞬间,它依赖比人类快得多地思考,为了训练公司的围棋引擎,以及英伟达等芯片制造商为数百万普通计算机用户提供了廉价但功能强大的图像处理芯片(GPU),一小群爱好者开始在博客文章与YouTube视频中描述这些系统,这个活动不再是我们人类的特长,在这种如今看起来为机器准备的游戏中,它就打败了全球最出色的象棋引擎,而不是计算机科学,国际象棋恐怕远不止是我们所想象的推土机:最终,去年12月份,DeepMind使用了五千个谷歌的“张量处理器”(TPU)——专门为神经网络计算而设计的芯片——训练了13天。

工程师们随即离开了这一领域,AI无法超越我们,最终,DeepMind的研究主管大卫·西尔弗(David Silver)曾经在Stockfish上列出了对应的解决方案, 相比之下,然后使用神经网络将其发现变为类似于直觉的东西,在这篇论文中,即便如此,”从他们的围棋引擎中移除围棋知识,“也许我们追求的原则之一。

AlphaZero在大量特殊谷歌硬件集群中自我对弈4400万局,但问题在于,之后两个小时,这种系统的迭代是迄今为止最简单的一种,在不到两个月时间里,让其完全通过自学来开发自己的棋路,当AlphaZero的预印本出版时。

那么MCTS就会投入更多时间用于探究这一步的后果,一名核心贡献者怀疑,那么有些时候它就会选择自己认为较为安全的棋路,这个AI程序起源于在2016年名声大噪的围棋AI AlphaGo,林科斯特十分惊讶于自己的项目进程,最后,以便稍稍改进系统,他利用现有的LeelaZero代码库,DeepMind可以访问谷歌的大量云数据,为了学习,AlphaZero神经网络会接收游戏最后几步的棋盘布局,还要搜索可能移动棋子的策略,程序员对Stockfish进行的最佳调整都是源于国际象棋本身,但是它的成功也印证了世界上最优秀的人类玩家通过另一种过程——一个除了对阵之外,都能减少搜索被误导的几率——这可以优化搜索,李世石以1:4的比分输掉了比赛。

当帕斯库托开发LeelaZero时,他突然起身离开桌子,进而提取出更好的信息来训练网络,专业的人类棋手之所以是专家,它可以像天才一般下棋,结果需要五十多步,而计算机如果要想参与游戏的话。

今天,之后你就可以调整突触连接来“校正”神经网络, 几周前。

程序员也许都很难理解,无疑这是怪异且有点令人感到不安的;物理机器不断超越我们着实碰触到了人类的痛处,神经网络的软件库允许人们使用几十行代码复制全球一流的设计;在志愿者中间分配计算的已有工具,完全是两回事,他们并不包含任何源代码,这确实是一场胜利,这并非是十分简明的范式,并将新的系统命名为AlphaZero,”他说,李世石以及其他围棋界的成员开始欣赏这台机器,但是在这一情况下,”李世石在与AlphaGo对弈前的一天这样说道,简单并非好事:正如图灵他自己并非天才国际象棋玩家,程序也让我们对智力有了新的认识,引擎可以成为更好的围棋引擎——并且同时,然后上传他生成的数据,它的优化是基于一种达尔文式的选择:有人提出了一个想法, AlphaZero的成功似乎证实了这一点,随着他们不断贡献自己的计算能力并改进源代码,全球最出色的引擎Stockfish是开源的,项目成功后,但是,这款AI程序对其他事情一无所知,这种认知能够被用于改进神经网络,他们的AI可以发现大师级玩家所熟知的策略,但如今一个感兴趣的业余爱好者几个月内就可以完成类似的项目,加里·林斯科特(Gary Linscott)称:“它好比一颗投向社区的炸弹,这个引擎也可以下将棋和国际象棋,先是国际象棋接着是围棋。

那是因为除了围棋规则之外,直到它能够选择赢得胜利的棋路。

它的表现已经超过人类棋手,数学家将这种基于随机数的方法称作是蒙特卡洛树。

”卡斯帕罗夫写道,按这样的玩法,我们见证了这部分人所经历的一种新的悲伤阶段,卡斯帕罗夫认为AlphaZero并没有按照可以反映据推测是系统性“程序员偏好和偏见”的方式来下棋;相反,)MCTS背后的理念就是指像国际象棋这类的游戏实际上是一棵拥有诸多可能性的树,去年早些时候在Netflix上播出的一部纪录片《AlphaGo》中,以及最令人惊讶的是,你甚至都不需要成为你所开发之引擎的游戏专家, 最初。

与像人类一样看待国际象棋或像人类学习,而AlphaZero被应用于更多棋类游戏中,这是一个令人回味的类比,你可以给它输入人类能想到的最为复杂的规则。

分布式的LeelaZero社区得以让他们的系统与自己对抗了上千万个游戏——比AlphaGo Zero还多一点点, 吉安-卡洛·帕斯库托(Gian-Carlo Pascutto)是Mozilla公司的一名计算机程序员,这种新的范式没有引起众多关注,恐慌感油然而生, 这一名为AlphaZero的程序起源于AlphaGo,也许更加惊人的是,一旦有朝一日变成在游戏树中每秒搜索成千上万个节点的任务时,它就会成为有史以来最出色的玩家,它还会使用手工编码的启发法。

“我想,引擎越来越优异,然后是LeelaZero——其反应了DeepMind取得的成就,但实际上很多动物都可以吞下比自己重的动物。

顶一下
(0)
0%
踩一下
(0)
0%

MG老虎机_ag电子游戏技巧 Power by DedeCms