徽帮棋友会

 找回密码
 立即注册
搜索
热搜: 围棋
查看: 7161|回复: 1
打印 上一主题 下一主题

一位职业棋手眼中的AlphaGo的实力

[复制链接]

968

主题

1138

帖子

4056

积分

论坛元老

Rank: 8Rank: 8

积分
4056
跳转到指定楼层
楼主
发表于 2017-6-4 11:09:10 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

这一篇不知道是什么时候写的,今天偶然在关西棋院里面看到的。第二季人机大战马上就要打响,虽然日媒相当不给力,但是自己就做一点力所能及的事情吧。


胜间史朗七段分了4个环节写,我就分上下两部分来看看胜间史朗七段对AlphaGo的看法。不过这篇文章有一点时间了,对第二季人机大战的内容是没有提及,不过从第一季的人机大战里选出了一些经典案例,我们也可以温故而知新。


原文网址:http://kansaikiin.jp/alphago/

作者:关西棋院棋士,胜间史朗 七段


序言

由谷歌开发的围棋AI“AlphaGo”,击败了围棋的顶尖棋手李世石,这新闻轰动了世界。

AlphaGo它是怎么进行思考的。然后它又是怎么超过人类的,现在是不是已经高过我们了?

从我这个职业棋手的视角,给大家做一个清晰明了的解释。


第一章 什么是深度学习

AlphaGo获胜的一大要因是采用了深度学习的思考方式,如果知道了什么是深度学习的话,就更理解AlphaGo的实力了。


首先我举个例子来解释什么是深度学习。

为了能更好的理解深度学习的结构,我就拿网上的翻译软件举例。


比如翻译“I Love You”的时候,如果很机械的翻译成日语就是「私愛してるあなた」(日语是主宾谓,所以这里就翻成“我你爱”),对此做一个统计。网上的数据说,在「私」后面跟着的助词有60%的概率会显示「は」(翻译就是“我……(怎么样)”)。而后面跟着的助词有30%的概率会显示「が」(翻译就是“我会……(怎么样)”),就像这样,深度学习将会把对统计的结果进行分类,就好比围棋里面的定式那样。


同样的,接在「あなた」(你)后面是「を」(把你)或者「に」(对你)或是「が」(你……(怎么样)),深度学习也会对此进行分类。然后深度学习就会自己明白,“I”对应的是「私は」(我……(怎么样)),“You”就对应「あなたが」(你……(怎么样)),像这样会预测翻译的结果。


然后我们进入第二层思考方式。

像前面那样,经过第一层思考之后,翻译的内容就是「私は愛してるあなたが」(日语是主宾谓,所以这里就翻成“我(怎么样)你(怎么样)爱着”)。然后再去进行统计,网上显示,在「私は」(我……(怎么样))之后跟「あなたを」(把你)的概率是55%,然后「あなたに」是40%。经过多次同样的检索,翻译成比如「私はあなたを」(我会把你……),或者「私はあなたに」(我会对你……)等等,会再次对翻译的结果进行分类。


于是我们把翻译再进了一步,将「私愛してるあなた」(我你爱)翻译成了「私はあなたに愛してる」(我对你的爱),然后将分类的内容更进一步。


最后,再次对“I Love You”的翻译内容进行一个概率的统计,其中10%的情况会出现私はあなたに愛してる」(我对你的爱),90%的概率会出现「私はあなたを愛してる」(我爱你),经过层层推导之后,将概率最高的结果作为深度学习的最佳答案,然后把这个答案呈现给了我们。


也就是说,深度学习就是把“I Love You”首先对每一个单词进行翻译,然后经过多次分组,让自己数据库里的内容变多,这样它就有了学习的过程。


从第一层思考,再到第二层,第三层思考,一个又一个阶层的思考就是“深度(Deep)学习(Learning)”,并在一起就是“深度学习(Deep Learning)”了。


下面我们从围棋的角度来谈谈深度学习。


第二章 AlphaGo的思考方式

前面我们把“I Love You”的翻译作为例子,AlphaGo也同样采取了这样的手段。为了方便让各位明白,我就用压长定式进行举例。



图1

图1就是压长定式,但在AlphaGo眼里这并不是压长定式,而是经过自己的统计和概率的判断进行推到,将这个形状作为一个局部进行了一个分类。


也就是说,只要黑1压一个之后,有60%的概率白2会选择扳一手。或者白2也有在A位长一个的选项,但是经过数据库的检索,白棋下在2位的出现率比较高,所以白2选择了扳。


但是白2是不是好棋,AlphaGo其实也不知道。至于AlphaGo凭什么只要统计和检索就可以获胜的原因,我在后面会说。


同样黑3也是,虽然黑棋也有在B位连扳的选项,但是白2扳之后有70%的概率会选择在黑3位长一个。之后也采用同样的办法,假如会下成到黑7这样的一个棋型。


在这个过程形成的变化图也会进行分类,然后做出选择,这个思考方式和翻译“I Love You”是一样的。


可能各位会误认为AlphaGo的思考方式只是在定式上面,下面的图2可能会对AlphaGo的思考方式更加清晰一些。




图2

像图2一样,在双方的目数都比较确定的情况下,黑棋有50%的概率会下在黑1。这样的话,白棋会有80%的概率下在白2。就这样根据统计和概率下到白6。


更进一步的说,在黑1之后,有70%的概率会下到白6,也就是说,将进行到白6的变化作为一个类别进行学习。


然后我们把前面的压长定式加进来。




图3

比如图3把前面的压长定式加了进了,在左边黑棋的模样之后,采用统计和概率进行推导,然后对黑1到白6的过程进行检索。


局面中,对各种变化图进行检索,假如黑下在A位之后黑棋有盘面10目的优势。然后采用同样的思考方式,选择出现概率最高的进展,以及将易于检索的一手棋作为下一手。


虽然这在我们人类的角度上来说,可以说是第一感的计算。但是对擅长统计分析的电脑来说,它们可能在做最高精确度的第一感的计算。


这是我们理解AlphaGo实力的一个很重要的要点,但这并不能说明,AlphaGo下出的每一手棋都是最好的。

我在第三章会讲解,我理解的AlphaGo的实力。



进入第4期会津病院杯女流立葵杯八强的棋手们


回复

使用道具 举报

968

主题

1138

帖子

4056

积分

论坛元老

Rank: 8Rank: 8

积分
4056
沙发
 楼主| 发表于 2017-6-4 11:09:54 | 只看该作者

第三章 职业棋手眼中AlphaGo的实力

我从两个角度来分析,第一个是为什么李世石会输给AlphaGo,第二个是对围棋的特征进行分析。

首先分析为什么李世石会输给AlphaGo,或者说,人类会输给AlphaGo。就像我前面举例的那样,AlphaGo通过自己的统计分析,把人类的棋谱导入在数据库中作为借鉴,然后寻找一个出现概率最高的变化图,对此进行归类,最后推导出一个自己可以最终获胜的局面。

也就是说,AlphaGo的每一手棋基本上都是不好不坏的棋,然后它将这一点保持到了最后。但是作为人类代表的李世石九段,肯定会下出一些坏棋,所以说,我们人类在这一点就已经输给了AlphaGo。

但是,我们人类也有不输于AlphaGo的地方,那就是大局观和对厚薄的判断。


这和我前面所说的一样,AlphaGo并不知道哪手棋是好棋,哪手棋是坏棋,它只是通过统计得到的数据,把出现频数最多的一手棋下出来而已。

即便有90%的棋是好棋,AlphaGo其实也没有对厚势的判断能力。所以我们还是要明白,AlphaGo对大局观还是没有形成自己的一套判断能力。


我们就拿AlphaGo对李世石的第四局作为例子。




图4

图4是黑棋的AlphaGo准备要下第83手的局面,前面白△的第82手是给神之一手锦上添花的一手棋。但是,这个局面下黑棋的形势依旧不落后,如果黑棋拥有大局观的话,可能会选择黑1到黑7的变化,这样AlphaGo感觉还是可以获胜的。


AlphaGo从检索开始推导“局部的棋型”,然后一层一层积累形成分支之后,将最终的终局图罗列出来,这是AlphaGo的惊人之处。

但是我们人类会根据全局情况来决定下一手下在哪里,这和AlphaGo的思考方式是完全相反的,如果进入了一个需要大局观的时候,人类的优势就显现出来了。但是,如果是比较“局部的棋型”的话,AlphaGo的数据之多足以完胜我们。


有趣的是,从第1局到第3局,李世石称AlphaGo把之前的数据作为参考然后决定下在哪里。虽然这条信息可能是坊间传闻,但可以肯定的是,AlphaGo输掉第4局的原因就是下出了AlphaGo数据库里没有的东西。因为“局部的棋型”是根据统计的数据下出来的,如果数据里没有这手棋的话,AlphaGo就只好下自己“会”的东西。

或许李世石九段在前三局感觉到了什么,然后第四局把棋局导入一个考验大局观的情况。所以李世石在第四局获得了胜利。


但是,第5局也可以说是一盘考验大局观的棋,不过临近终盘,我们很清楚的知道已经不敌计算精准度优于我们的电脑,所以说,或许第5局才是真正意义上的人类输给了电脑。

AlphaGo将我们职业棋手的思想吸收了进去,在此基础上通过人工智能将李世石九段击败,可以说是将各方面的优势都纳入了进来,才有了这样的精彩对局。


关于围棋的特征,作为职业棋手的我也稍微说几句。



图5

图5就拿第2局的第37手,一度成为话题的肩冲。

AlphaGo下出了一手“职业棋手根本想不到的棋”,由此引发了电脑是否已经超过职业棋手的话题,因为围棋的特征,只要局面没有彻底定型,下在棋盘上的任何地方,出现的结果都有可能是不一样的。

也就是说,这时候不仅可以下在黑1,下在A,B,C任何一处都会是另一番景象,可能下在A或者C,认为这手棋是好棋的可能性会高一点。


但是AlphaGo下在了黑1位,此后白棋的下一手棋可能就会在D或者E这两个选项,但是AlphaGo事先对之后的进行做了一系列的分支。所以由此可以知道,AlphaGo认为这手棋比较易于自己去搜索。这也可以说明AlphaGo的每一手棋,并不都是当前局面下最好的一手棋。


但是我们职业棋手会选择“这手棋是好棋的可能性比较高”要比“这手棋不好不坏”要多得多,所以说,黑1是根本不在我们的思考范围内。

但是只要对手应对正确,哪怕这手棋是“这手棋好棋的可能性比较高”,也会变成像黑1一样“这手棋不好不坏”。这就是我们人与人对局,和电脑思维方式的不同。

以我们职业棋手的认知,我们不得不去改正的地方是,认为黑1这手棋不好不坏上面吧,也就是我们职业棋手根本不会考虑的棋。


第四章 今后的围棋

现在人类的围棋被电脑击败成为了事实,这对今后围棋的下法有何影响呢?

比如说,到哪里都可以和拥有职业水平的软件进行对局,虽然实力差的太多可能意义就不大了,比如能达到业余6段水平的话,我们就用这款软件进行对局,棋力或许会有所提升。

或者,如果想知道这盘棋自己输在了哪里,只要通过软件,就可以给出一个比较合适的答案。但是,就像我前面说的,电脑的每一手棋并不都是好棋,即便确实是好棋,它也没法说明白这手棋为什么好。

针对这个问题,人工智能的研究者也产生了分歧。

比如说,过了几十年出现了一款跟人长得一模一样的机器人,当机器人对人类示爱进行表白的时候,可能会说“I Love You”,但是机器人可能不理解这句话的意思,可能是只要有漂亮的女性或者帅气的男性出现,就会说“I Love You”,因为这是程序设计出来的东西,所以并不能代表机器人真的喜欢上了这个人才会说“I Love You”。

这里的争论点就是,这究竟是不是叫做人工智能,还是我们人类本身就需要这个东西。


围棋也是有同样的情况,电脑可以出示给你一手好棋,我们知道了这是好棋,但是这手棋究竟好在哪里,现阶段只能通过统计分析,写出这样比较死板的回答,这就是现在人工智能的实力。

至此,我们人类可以去评判这手棋好在哪里,还有可以去当解说的价值。我们可以期待的是,今后我们可能会是借助电脑摆出的变化图,然后再有人对这盘棋进行解说的时代。这样就有助于我们可以提升棋力,再借助电脑的力量,会更加容易去实现。那样的话,我们就能更好地感受到围棋的乐趣吧。


说这么多,电脑依旧是我们人类的使用工具,我们现在需要做的是,要如何更好的利用电脑。电脑作为我们现代的工具,对培养思考能力的围棋来说,电脑会是一个非常好的工具之一。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

徽帮棋友会 ( 苏ICP备2022041640号-1

GMT+8, 2024-11-11 04:50 , Processed in 0.249822 second(s), 19 queries .

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表