AlphaGo与人类的恩怨情仇（4）-初试啼声：（下）

安徽工行 · 发表于 2018-3-1 20:41:43

本文首发于知乎专栏——不一样的围棋，作者，不会功夫的潘达

输棋后的樊麾表现得难以置信，但他并没有多少用来调整的时间。当天晚些时候，樊麾与AlphaGo再战一盘非正式对局。结果是樊麾取胜。棋谱没有公开，所以我们无从得知棋局中间发生了些什么。不过，樊麾大概恢复了一些自信，这可以在次日的第二盘正式对局中看出端倪。

AlphaGo（黑）- 樊麾（白）对抗赛第二局，1-12手

刚一开局，樊麾直接祭出“大雪崩”定式。此形如白雪从黑山坡上滑落（把上图的黑白交换一下即可），因而得名“雪崩”。“大雪崩”，与“妖刀”、“大斜”并称围棋“三大难解定式”，变化莫测，而且常有新变。大雪崩是难解定式中，近年在职业赛事中出现最频繁的一个。在2015年百灵杯决赛第三局中，邱峻就在大雪崩定式中藏了一把飞刀，令柯洁猝不及防，结果棋局早早失去悬念。既然顶级棋手在大雪崩中都会犯错，那么AlphaGo会如何表现呢？

1-44手

笔者棋力有限，对大雪崩的千般变化不甚了了。接下来一段的内容参考金明完九段的解说。

金明完认为，白26粘是旧定式。比较新的变化是改走E6位扳。如果AlphaGo不犯错，白26粘以下的变化应该是黑棋稍好。但紧接着，AlphaGo立刻犯下了一个错误：黑31。

如果没有实战中黑31与白32的交换（即上图中O与X），其它手顺保持不变，则G2位的黑9是先手。白棋必须在左下角补棋，否则被黑10立下全灭。黑9白10交换以后，白6、8气势汹汹的攻势显得相当浮夸。黑棋既可以A位轻松逃逸，或者B位穿断反击，令主动权易手。

如果是大雪崩的另一变，如上图，则白棋在B位点入，赚取官子便宜，且保证上边一块的眼位，就是正着。在此局面下，下边一块不再有先手，于是左边的点入也就不必保留。

AlphaGo在此处的错误，大概是策略网络从人类棋谱中学到了这一着，知道在相似棋型下，“点入”是有效的手段，但并不能准确的判断点入的场合。如果AlphaGo是一名人类棋手，可以评价为“知其然，而不知其所以然”。

随后黑棋甚至都没能将黑31一子救回，被白38先手笑纳，局部亏得吐血。持白棋的樊麾借着AlphaGo的失误，白40、42、44连续压迫，心情愉快。棋下到这里，也许樊麾觉得自己要赢了吧。

棋谚云，“一着不慎，满盘皆输”。之前顺风满帆的樊麾想以持续压迫黑棋巩固优势，却立即遭到AlphaGo的强力反击。黑55、57冲断白棋以后，白棋深陷乱战，54、58两子，及42这一块白子均有风险。不过，此处白棋若处理得当，脱困并不难，棋局还很漫长。然而……

白62，本局败招。此处的变化对于樊麾来说应该难度不大，实战犯下如此低级错误，可能是心态波动吧。被黑棋扳到71，白棋右下五子全灭，棋局实际上已无以为继。接下来的一百多手，白方奋力拼搏，但没有找到逆转的机会。本局双方各有犯错，但樊麾的错误更为严重，以至于“突然死亡”。

接下来的第三局，只说一个局部。

AlphaGo的白60，猛一看像是好棋。职业棋手常用类似手段，在边角处占一点便宜，或者制造一个劫争。然而，黑61挡，干净利落地吃掉入侵的白子。此处AlphaGo犯的错误和第二局大雪崩中的一“点”相似，都是在貌似可行的棋型下，实际上并不成立的手段。这可以解释为AlphaGo的策略网络已经能够敏锐地像人类高手那样感知棋型，并挑出候选的手段；但AlphaGo的后续计算准确度尚不足够高，导致有时仍会犯低级错误。

不过，即使AlphaGo在此处犯错，白棋依然掌握主动。白64断以后，黑棋在右上陷入苦战。最终黑右上被全歼，从而告负。至此樊麾以0-3落后。

在后来AlphaGo战胜樊麾的报导中，都有樊麾双手抱头懊恼的照片，棋盘上正是第三局的终局画面。

第四局，执黑的AlphaGo发挥近乎完美。

AlphaGo （黑） – 樊麾（白）对抗赛第四局，1-20手。

左边的定式，执黑的AlphaGo在11拆、13跳，堂堂正正，和人类教科书里的下法一模一样。之后我们还会看到左下角的“托退定式”，以及AlphaGo不一样的表演。

然后AlphaGo在右边布下三连星。金明完评曰，“黑棋左右阵势遥相呼应，而白棋14尖略缓，布局至此黑好”。

接下来，孤单的白18一子被黑棋猛攻。半途中，白32一着不慎，被黑棋强硬分断。

白棋两边都是苦战。结果黑71心慈手软，放白棋右边大块一条活路。若黑71改走A位尖，则局部白棋没有一个眼，非常危险。不过，即使黑棋放活白棋，仍然保持优势。

下边的战斗，黑棋计算精准，先手将白棋打成一条“光棍”，继续巩固优势。

最终樊麾眼看棋局不利，在左上角“玉碎”，AlphaGo再下一城。

最后一局，前面的部分略过不提，我们还是只说一个局部。

左上角的劫争，持续了十个回合。AlphaGo在过程中，找劫、应劫、判断得失，毫厘不爽。最终双方形成对等的转换，AlphaGo也保全胜利果实。有此劫争为先例，我不是很懂为什么在后来AlphaGo与李世乭对战期间，有那么多围观群众、棋迷、甚至棋手传播AlphaGo不会打劫的谣言。即使是上一代的AI，如Zen，应对单个的劫争，也不会犯大错。AlphaGo在此劫争中的表现，没有无谓地浪费劫材，也没有找损劫，表现出了比Zen高至少一个档次的实力。

AlphaGo赢了。五比零。这是历史上首次由人工智能在分先（平等）的棋份下战胜一位职业棋手，而且是完胜。2016年1月，介绍AlphaGo成果的论文登上《自然》杂志封面。这是对DeepMind团队取得阶段性成果的最好肯定。

成功并未丝毫影响DeepMind团队的判断力，他们对AlphaGo的实力有客观、清醒的认识。在论文《Mastering the Game of Go with Deep Neural Networks and Tree Search》中，参考樊麾职业二段(2p)的段位及8：2的总对战成绩，DeepMind团队将AlphaGo的实力评为职业五段，等级分3150分。从他们参考的等级分体系来看，3150分相当于中国的二线职业棋手水平。（参见谷歌围棋程序AlphaGo实力几何？ – 知乎专栏）这与后来中国职业棋手对AlphaGo基于棋谱的实力评价基本一致。

当时，与李世乭的比赛时间已经敲定。想在几个月的时间里，让AlphaGo从一名平庸的职业棋手，成长为超越顶尖职业棋手的存在，并非易事。为此，哈萨比斯请回“手下败将”樊麾做AlphaGo的教练，为AlphaGo捉虫。人类与AlphaGo由对手变成了伙伴，这是第一次，在将来会变成常态。

历史性的一战，即将展开。

		自动登录	找回密码
密码			立即注册