围棋go 人工智能？围棋go 人工智能教程

日期： 2024-01-03 08:55:06 浏览：3

大家好，关于围棋go 人工智能很多朋友都还不太明白，今天小编就来为大家分享关于围棋go 人工智能教程的知识，希望对各位有所帮助！

本文目录

mastergo优缺点
为什么顶级围棋选手还可以和人工智能平分秋色而象棋选手却不能？
人类制造出来的最为优秀的围棋AI是什么
以围棋胜负来判定人工智能高低能否可行？

mastergo优缺点

MasterGo是一款围棋人工智能软件，由中国的一个IT企业DeepInfo建立。MasterGo围棋人工智能从早期的AlphaGo到后来的AlphaGoZero根据深度学习和神经网络不断进化，以至于成为一个专家级别的围棋程序，在追求极致的游戏体验方面被一些职业棋手和玩家认为是最优秀的围棋AI之一。下面是MasterGo的优缺点：

优点：

1.最强AI水平。在人类最顶级的棋手里，MasterGo具有相当的实力，甚至在人类顶级棋手中占优。

2.人机对战模式完备、随时可以观看多种媒体，包括文字及视频。

3.有着非常完美的可视化操作，交互友好简单易懂。

4.基于可定制性，能够根据个人需求设定各种参数。

缺点：

1.价格相对较高，在竞品中算是比较昂贵的。

2.由于采用了蒙特卡洛树搜索算法，在许多场合下需要在运算器上工作，高速操作条件较差。

3.操作系统和计算机性能的限制使得运行MasterGo的平台需要较高的要求。

总体而言，MasterGo围棋人工智能软件在“围棋人工智能”领域是比较出色的，但也需要考虑到软件自身的运行环境、价格等各种因素。如果对围棋有较深入的了解或者工作需要，可以考虑购买。

为什么顶级围棋选手还可以和人工智能平分秋色而象棋选手却不能？

科普一下。现在人工智能的发展已经到了在各种棋类游戏中没有人能战胜的阶段。人类围棋的顶尖棋手和AlphaGoMaster的网络对战成绩是0:60。而Master还不是AlphaGo的最高级版本。而1997年IBM的深蓝战胜了等级分排名世界第一的棋手加里·卡斯帕罗夫。战绩3.5:2.5（2胜1负3平）。19年后Google的AlphaGoMaster也战胜了等级分排名世界第一的棋手柯洁。

那么现在人类顶尖棋手和AI到底有多大差距呢？唯一战胜过AlphaGoLee的韩国著名顶尖棋手李世石的隐退棋是和韩国的AI韩豆下的。AI让两子，黑棋贴3又3/4子。在这种条件下开局AI的胜率已经无限接近于1%。但是结果还是AI2:1胜出了。

为什么AI会这么强大？它是怎么超越人类的呢？其实AI的成长过程一直是仿生的过程。所有的棋类比赛较量的都是规则下进行计算的能力。1997年版本的深蓝运算速度为每秒2亿步棋。1997年的深蓝可搜寻及估计随后的12步棋，而一名人类象棋好手大约可估计随后的10步棋。正如中国古代军事家孙子所说："夫未战而庙算胜者，得算多也。未战而庙算不胜者，得算少也。多算胜，少算不胜，而况于无算乎！"。

那么为什么计算机要19年后才能在围棋上战胜人类呢？还是计算的问题。围棋对AI的挑战难点在棋盘空间。国际象棋的空间状态是1043。而围棋是10170个状态空间。这样的游戏具有高分支因子。围棋中的可能场景的数量要大于宇宙中的原子数。光照顾了棋局的宽度（变化）就照顾不了棋局的深度（考虑的步数）。所以围棋职业棋手2016年之前一致认为计算机不可能下过人类顶尖棋手。

从当时的情况看计算机确实是有点“机关算尽”了。于是科学家们开始研究新的思路。在资源有限的情况下人是怎么办的？最典型的例子是种花、果时要打尖、疏果。因为植物的营养是有限的。不打尖、疏果就不能得到好的结果。围棋棋盘上的空间状态虽然多但是每个空间状态的价值是不同的。所以对变化的计算要剪枝。问题转化为应该剪除谁？

解决这个问题的就是蒙特卡洛算法和神经元网络的深度学习。

什么是蒙特卡洛算法？举个例子：有一个箱子里边有无数个苹果。想找出最大的。但是人从外边看不到苹果的大小。每次可以随机取出一个。然后和上一次的比较。大的留下。这样重复100次、1000次之后是什么结果呢？留下的不一定是最大的苹果，但一定是在目前最接近最大苹果的苹果。

和蒙特卡洛算法对应的是拉斯维加斯算法。也举个例子：还是，一个箱子里边有无数把钥匙。想找出能打开一把锁的钥匙。还是每次可以随机取出一把来试。打不开扔掉。这样重复100次、1000次之后是什么结果呢？有可能碰上了，但是不保证一定能碰上。

人下棋时是通过过往的经验来做选择。AI也是通过过往的经验找出最接近正确答案的值给每一个选择点赋值。而人们看到的是每着的胜率。

AI是怎么给每一个选择点赋值的呢？这就离不开神经网络和深度学习。人能思考的物质基础是人的神经网络。AI的神经网络系统就是仿生的结果。有了这个物质基础就有了机器学习。深度学习是机器学习的一部分。深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力。深度学习是一个复杂的机器学习算法，又分为有监督学习和无监督学习。

老师留作业，学生做习题集。其实就是一种有监督学习。通过做题掌握了解题规律。于是考试时只要是做过的题型基本上都会。

现实生活中还常常会有这样的问题：缺乏足够的先验知识，因此难以人工标注类别或进行人工类别标注的成本太高。很自然地，我们希望计算机能代我们完成这些工作，或至少提供一些帮助。比如在没有计算机的情况下人通过对大量的数据长期观察思考，找到了克山病的原因。但是这个研究发现其规律的过程长达几十年。AI的无监督学习就是模拟人的这个学习过程。可以加快人们对未知事物的理解。

深蓝和阿尔法狗最初都是用人类的棋谱喂养的。比如战胜李世石的AlphaGoLee就大约喂了16万人类棋谱和数万个人类人类总结的模式（定式）。但是最后开源的AlphaGoZero则是从零开始通过“左右互搏”自己通过超过1亿对局自己悟出的围棋真谛。自学成才的AlphaGoZero水平不但远超AlphaGoLee，就连横扫千军的AlphaGoMaster也不是AlphaGoZero的对手。这就是职业棋手说的AlphaGoLee的棋还能看出高明的地方（因为有人类的影子），AlphaGoZero的棋则净是看不懂的地方。许多过去的共识被纠正。数以万计的定式被废弃。

2005年左右《围棋天地》曾经有一个栏目是访问一线棋手：如果有围棋上帝的话你和他有多大差距。记得当时一致的看法是让两子。而现在顶尖棋手和AI的差距已经差了两个子。那么AI是不是围棋上帝呢？肯定不是。它只是接近最优解，而不是最优解。也就是说AI只是相对真理，是绝对真理的一部分。它并没有穷尽真理。最好的例子就是“芈氏飞刀”。这个定式是在流行AI定式的大形势下人类发明的定式。最开始AI也不认识，吃了亏后变成AI在一个时期里的常用定式。

AI的发展还远没有达到尽头。从AlphaGoLee到AlphaGoZero都有一个习惯就是见好就收。前边优势很大但是当它算到怎么下都能赢的时候就会退让。最后只赢一两目。作为人类棋手的陪练这是不称职的。所以人类要给它增加个性。中国的AI星阵就加入了“不退让”的个性。

曾经有人预言AI会使围棋衰落。我不这么认为。古代无论东西方绘画都有追求像的趋势。但是当照相机出现后，画得再像也赶不上照相机。但是绘画仍然向前发展并没有衰落。只不过现在追求的是意境和感受了。围棋在商业因素的影响下从两日制演变到包干制的快棋。人的能力在哪摆着，棋的质量不可能不受影响。当信奉“天下武功唯快不破”的时代遇到任谁也快不过的AI。这种“快”还有意义吗？

人类制造出来的最为优秀的围棋AI是什么

就目前看来，人类制造出来的最优秀的围棋al，还是alfhaGo（也被称为阿尔法狗）。阿尔法go面世后，先是战胜了一位七段棋手，引起了围棋界的轰动，但是当时，大家还不认为它会战胜顶尖的职业棋手。

然后举行了顶尖高手李世石和阿尔法go的五番棋大战，最后阿尔法go以4：1战胜了李世石。大家才承认人工智能已经超过了职业棋手，以后，顶尖起手都把人工智能作为训练的辅助工具。

以围棋胜负来判定人工智能高低能否可行？

先给一个肯定的回答，就目前人工智能的发展来说，如果以围棋的胜负来判定其能力的高低是可行的。

咱们可以先看1997年IBM公司的人工智能“深蓝”，它在国际象棋上击败了国际象棋大师卡斯帕罗夫。

根据这位大师的回忆，在1985年的时候，他战胜阿纳托利·卡尔波夫之后成为世界国际象棋冠军。在那一年，他在德国汉堡与世界上最先进的32台象棋电脑展开了一场车轮战。比赛结果全盘获胜。然而，仅仅12年后的1997年，大师需要拼尽全力对战一台计算机，当时的《新闻周刊》把这场比赛称为“人脑的最后防线”。那一年象棋计算机在科技的加持下，实力大增；而大师正好又是国际象棋冠军，于是代表全人类与机器进行了那场至今仍然家喻户晓的对决。他与IBM“深蓝”计算机下了两盘棋，一胜一败。

大师将计算机的胜利归功于“深蓝”计算机的创造者，许峰雄（电脑“深蓝”的设计者，出生于中国台湾，毕业于台湾大学和卡内基·梅隆大学），并向他和他的团队由衷致敬。因为机器的胜利也是人类的胜利（因为人类是机器的缔造者），当时的“深蓝”能够在一秒钟内分析出惊人的200万个棋位。

但那个时候有人说，围棋是人工智能无法攻克的壁垒，是因为围棋计算量实在是太大了。选择围棋除了这个，还有一个原因。

1、对于计算机来说，每一个位置都有黑、白、空三种可能，那么棋盘对于计算机来说就有3的361次方种可能，而宇宙的原子只有10的80次方。下图是围棋的复杂程度卷积。

但令人震惊的是在2016年3月份，AlphaGo以4-1的比分击败李世石。而AlphaGo的算法也不是穷举法，而是在人类的棋谱中学习人类的招法，不断进步，就是我们说的机器学习。而它在后台，进行的则是胜率的分析，这跟人类的思维方式有很大的区别，它不会像人类一样计算目数，而是胜率，它会将对手的信息和招式完全记录下来，如果对手没有新的招式来应对，输的概率是非常之大。

2、围棋作为一种开启智力的“游戏”，已有3000多年的历史，人机对弈也有近50年历史。《大英百科全书》中说：“围棋，公元前2356年起源于中国。”自古以来，围棋备受帝王、将军和知识分子、神童的喜爱，在国外包括爱因斯坦、约翰纳什和图灵等都是围棋的爱好者。围棋的英文就是“Go”，所以人家其实不叫阿尔法狗（只是咱们中文的谐音），真正的叫法是阿尔法围棋。

阿尔法围棋有哪些特别之处？

阿尔法围棋是一个中央处理器（CentralProcessUnit，CPU）和图形处理器（GraphicProcessUnit，GPU）一起工作的围棋智能机器人。

阿尔法围棋以神经网络、深度学习、蒙特卡洛树搜索法为核心算法。系统由四部分组成：1、策略网络（PolicyNetwork），以当前局面为输入，预测下一步的走法；

2、快速走子（FastRollout），目标和策略网络相似，在适当牺牲质量的条件下的加速走法；

3、价值网络（ValueNetwork），以当前局面为输入，估算胜率。

4、蒙特卡洛树搜索（MonteCarloTreeSearch），把上述三个部分整合起来，形成完整的系统。

早期的阿尔法狗有176个GPU和1202个CPU。GPU能够通过内部极多进程的并行运算，取得比CPU高一个数量级的运算速度。

阿尔法围棋（AlphaGo）是通过两个不同神经网络“大脑”合作来改进下棋。这些“大脑”是多层神经网络，跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始，去处理围棋棋盘的定位，就像图片分类器网络处理图片一样。经过过滤，13个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。

第一大脑：落子选择器（MovePicker）

阿尔法围棋（AlphaGo）的第一个神经网络大脑是“监督学习的策略网络（PolicyNetwork）”，观察棋盘布局企图找到最佳的下一步。事实上，它预测每一个合法下一步的最佳概率，那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。

第二大脑：棋局评估器（PositionEvaluator）

阿尔法围棋（AlphaGo）的第二个大脑相对于落子选择器是回答另一个问题，它不是去猜测具体下一步，而是在给定棋子位置情况下，预测每一个棋手赢棋的概率。这“局面评估器”就是“价值网络（ValueNetwork）”，通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的，但对于阅读速度提高很有帮助。通过分析归类潜在的未来局面的“好”与“坏”，阿尔法围棋能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行，那么AI就跳过阅读。

阿尔法围棋（AlphaGo）此前的版本，结合了数百万人类围棋专家的棋谱，以及强化学习进行了自我训练。后来它又有了个弟弟AlphaGoZero，其能力则在这个基础上有了质的提升。最大的区别是，它不再需要人类数据。也就是说，它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋，然后进行自我博弈。

据阿尔法围棋团队负责人大卫·席尔瓦（DaveSliver）介绍，AlphaGoZero使用新的强化学习方法，让自己变成了老师。系统一开始甚至并不知道什么是围棋，只是从单一神经网络开始，通过神经网络强大的搜索算法，进行了自我对弈。随着自我博弈的增加，神经网络逐渐调整，提升预测下一步的能力，最终赢得比赛。更为厉害的是，随着训练的深入，阿尔法围棋团队发现，AlphaGoZero还独立发现了游戏规则，并走出了新策略，为围棋这项古老游戏带来了新的见解。

一个大脑：AlphaGoZero仅用了单一的神经网络。AlphaGo用到了“策略网络”来选择下一步棋的走法，以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中，这两个神经网络合二为一，从而让它能得到更高效的训练和评估。

神经网络：AlphaGoZero并不使用快速、随机的走子方法。在此前的版本中，AlphaGo用的是快速走子方法，来预测哪个玩家会从当前的局面中赢得比赛。相反，新版本依靠地是其高质量的神经网络来评估下棋的局势。

文章分享结束，围棋go 人工智能和围棋go 人工智能教程的答案你都知道了吗？欢迎再次光临本站哦！

关键词：机器学习阿尔法围棋围棋人工智能

本文地址： http://www.suancui.cn/rgzn/27282.html

围棋go 人工智能？围棋go 人工智能教程文档下载： PDF DOC TXT

上一篇：微众银行人工智能(微众银行人工智能)

下一篇：推特人工智能，推特人工智能聊天

围棋go 人工智能？围棋go 人工智能教程

mastergo优缺点

为什么顶级围棋选手还可以和人工智能平分秋色而象棋选手却不能？

人类制造出来的最为优秀的围棋AI是什么

以围棋胜负来判定人工智能高低能否可行？

相关文章