李喆六段解析AlphaGo：围棋之神与最优贴目

安徽后卫 · 发表于 2017-5-27 21:54:46

李喆六段发表微博

　　2017年5月27日，为期5天的人机大战在中国桐乡落下帷幕。柯洁最终还是没有战胜AlphaGo这个强大的对手。赛后，DeepMind团队在发布会上表示将公布AlphaGo的自战对局。李喆六段随即发表了微博长文，表明自己对AlphaGo的看法。

　　问：AlphaGo是不是围棋之神（或者说围棋上帝）？

　　答：不是。我们现在不清楚除了仅存在于理论上的穷尽方法，还有什么路径可以达到围棋之神。但我们可以从算法得知，神经网络+蒙塔卡洛，终归要依靠概率来下棋，可以不断趋近却达不到围棋之神。有一种可能性是AI下出来的棋达到了最优解但不自知（不可自证为最优解），但这种可能性极小，且不可能得到全部的最优解集合。

　　问：人类棋手还有可能分先击败达到AlphaGo这种水平的围棋AI吗？

　　答：理论上是有可能的，只是概率很低。问题只在于这个概率在实践的意义上是否可以忽略不计。

　　问：可否借助AlphaGo来确定最优贴目？

　　答：理论上的最优贴目，一定不存在半目。根据去年的演讲，AlphaGoLee（V18）判断黑白棋的起始胜率是48%：52%；今年的Master，听到的起始胜率有47%：53%和45%：55%两个版本。无论是哪个，都可以看出：随着水平提升，白棋胜率进一步提高了。这其实是可以预见的，软件的水平越高，计算越精确，起始占优一方的初始胜率就会越高。这并不能证明贴6.5目更合理，理论上贴n.5目都必有一方天然占优，随着软件水平越高，初始胜率越倾斜。如果目前黑白初始胜率相差了10%，基本上意味着执白的容错率明显大于执黑。反映到人机对弈，就是人执白时容易将局面的平衡保持更久一些，局面也容易变得精彩一些，执黑则很容易序盘一两步疑问手胜率就掉到40%以下，进入安乐状态。因此才有周睿羊同学猜到黑棋被小伙伴吐槽。

　　真正的正确贴目一定是整数，如果用数子法，一定没有1/4子，而是N子半。例如7路棋盘，正确贴目用数目法是9目，用数子法是四子半；6路棋盘，则是数目法贴3目，数子法贴两子。双方最优，即为和棋，最优解远不止一种。

　　回到19路围棋，以目前的人机各方面数据来看，数子法贴三子半，即黑棋184为和棋，很可能是最为合理的贴子数（如果还棋头，可能是四子半）。两个围棋之神来下，将会有极多的路径通往最终的和棋，这个和棋是指以双方子差为正确贴子，目前猜测为三子半（用数目法则可能是6或7目，数子法的最优解集合大于数目法的最优解集合）。但如果贴三又四分之三子或者6.5目，就变成猜先定胜负。

　　问：如何判断围棋AI的水平以及人、AI和围棋之神之间的水平差距？

　　AlphaGo仍然在不断进步，它的进步会反映在新旧版本对弈的胜率上，但反映在棋谱上，已经不是棋手能够看出来的了。

　　有一个标准可以参考：对于围棋AI而言，在现有的贴目规则下，黑白初始胜率差距在一定程度上反映了AI的水平。越强的AI，初始胜率很可能会越倾斜，初始优势越能发挥出来。而当采用了正确贴目时，AI自对弈的和棋概率越大，可能说明其水平越强。达到围棋之神，就是100%和棋。

　　对人而言，假如贴三子半，和棋概率还是远小于国际象棋和象棋的，因为和棋的空间小得多。多说一句，所谓三劫循环和棋是不存在的，AI完美适应禁全同规则。围棋的和棋只能是在贴目后的双方相等。

　　围棋可能是所有棋类运动中，唯一在理论上可以通过正确贴目的设置使得先后两方在平衡性上达到完全平衡的棋。象棋虽然和棋概率高，但先行总有优势。五子棋为了限制先行优势打了很多补丁，但仍不能完全平衡。能够在理论上完美平衡的，只有围棋。在正确的帖子数下，有难以计数的最优解变化，这些最优解变化对人而言和围棋的总变化数一样近乎无穷，这些路径最后都指向了和棋。我想这是吴清源大师说“围棋是中和”在科学解释上的意义。简单来说，理论上存在的完美穷尽的围棋，不是一方直接认输的棋，也不是只有一条路的棋，而是千变万化不离其宗、发而皆中节谓之和的棋。

　　如果仍然是贴三又四分之三子，AlphaGo的初始黑白胜率差很可能还会不断加大，我们可以通过胜率差来判断其进步的程度。听DeepZen的作者说AlphaGo已经可以适应任何贴目，那么如果调整为三子半，可以较快看到是否平衡。假如平衡，那么以AlphaGo现在的实力，应该自对弈每盘都有很大概率下成和棋，这个概率的大小能够证明实力。假如不平衡，可以再调整贴子数。

　　半目的设定其实只有不到百年的时间，是日本棋界的贡献，在围棋几千年的历史中出现很晚，但我们今天已经习以为常。从围棋真理去考虑，半目是不合理的设定，甚至从艺术美感上看，它破坏了围棋原有的独特的平衡之美。它的用处，是使得围棋从一个双方完美即为和棋的游戏，变成了一个非胜即负的游戏，增强了它的竞技刺激。从科学的角度，贴目制的出现是进步，但半目是画蛇添足，或者说是阶段性的设定。随着围棋AI越来越强，贴含半目的棋将越来越不平衡，这或许将会迫使我们重新思考和制定贴目。

　　可以猜测，以AlphaGo目前的实力，可能会出现不少半目胜负的棋，要么最终半目胜负，要么将要半目负的一方看清之后变招。如果想要借助围棋AI来探究正确贴目，接下来应调整贴目为整数（数子法为n子半），以AI不断变强的水平，可能会很快探明n等于几（目前的信息告诉我们多半是3）。这样还有一个好处，可以由此来辅助判断AI与围棋之神的距离。如果在正确贴目下AI能够100%和棋，那它就有触到围棋之神的可能性（似乎仍不能达到，因为围棋之神是穷尽所有最优解），这将成为判断的重要依据；只要达不到100%，就必定不是围棋之神。

　　这是AlphaGo在围棋的科学研究上的一个重要价值。之前谈过的人机协作，将会是未来的重点，对此我们的讨论和研究还是太少了。

　　刚看到新闻说AlphaGo将会每天更新10局自对弈棋谱！不多说了，学棋去。

		自动登录	找回密码
密码			立即注册