【经典网站】Alphago:谷歌阿尔法围棋官网

发布时间：2020-09-16

Alphago(中文名称为阿尔法围棋或阿尔法狗)是由英国伦敦Google DeepMind开发的人工智能围棋程序，成为第一个不借助让子，在全尺寸19×19的棋盘上击败职业围棋棋手的电脑围棋程序，也是人工智能与人类智慧的一大挑战。

2016年3月在一场五番棋围棋比赛中，AlphaGo于前三局均击败职业围棋棋手李世乭，成为第一个不借助让子而击败职业九段围棋棋手的电脑围棋程序。

专业术语上来说：AlphaGo其做法是使用了蒙地卡罗树状搜索与两个深度神经网络相结合方法，其中一个是以估值网络来评估大量的选点，而以走棋网络来选择落子。在这种设计下，电脑可以结合树状图的长远推断，又可像人类的大脑一样自发学习进行直觉训练，以提高下棋实力。

AlphaGo和之前的围棋程序相比表现出显著提升。在和Crazy Stone和Zen等其他围棋程序的500局比赛中，AlphaGo(运行于一台电脑上)仅输一局。而在其后的对局中，AlphaGo(可运行于多台电脑上)在500局比赛中全部获胜，且对抗运行在单机上的 AlphaGo 有 77% 的胜率。2015年10月的分布式运算版本AlphaGo使用1,202块CPU及176块GPU。

然而 Google 并没有公开解释从2015十月到2016三月间的实力增强有什么硬件或软件的改进，所以在三月进行的竞赛中可能进一步运用更多的硬件。

AlphaGo使用蒙特卡洛树搜索，借助估值网络与走棋网络这两种深度神经网络，通过估值网络来评估大量选点，并通过走棋网络选择落点。AlphaGo最初通过模仿人类玩家，尝试匹配职业棋手的过往棋局，其数据库中约含3000万步棋着。一旦它达到了一定的熟练程度，它开始和自己对弈大量棋局，使用强化学习进一步改善它。围棋无法仅通过寻找最佳步来解决;游戏一盘平均有150步，每一步平均有200种可选的下法，意味着有太多需要解决的可能性。

【经典网站】Alphago:谷歌阿尔法围棋官网

相关内容推荐：