徽帮棋友会

 找回密码
 立即注册
搜索
热搜: 围棋
查看: 10955|回复: 0
打印 上一主题 下一主题

AI的阿喀琉斯之踵——当今围棋界和AI的共处方式(5)

[复制链接]

2207

主题

2615

帖子

8343

积分

论坛元老

Rank: 8Rank: 8

积分
8343
跳转到指定楼层
楼主
发表于 2021-5-18 01:16:13 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

记者:白鸟士郎

嘉宾:大桥拓文 六段

翻译和整理:找借口安静 我又把这个连载忘了



白鸟士郎:我们能下载简易版的软件吗?


大桥拓文:不能,不过我们可以把在那个平台上下的棋,用绝艺进行复盘。


白鸟士郎:哦哦哦!


大桥拓文:平时用用还是挺方便的,不过只用1秒钟就会把结果从中国那边传过来。


白鸟士郎:这么说算路并不深啊,这样的话职业棋手是不是就不够用了?


大桥拓文:是的,不过职业棋手从中获得提示,然后用自己高性能的电脑进行验证。当然了,他们用的就不是绝艺那样的AI了。


白鸟士郎:绝艺下的棋,是不是很独特呢?


大桥拓文:并非如此,在布局上面,人类和AI感觉还是非常相似的。不过总的来说是人类棋手接近了AI,但是中盘之后AI就实在是太强了,很多地方就不是我们可以理解的了。


白鸟士郎:这和将棋界还是很相似的,不过用了深度学习技术的将棋AI,在终盘阶段的计算上面有一些困难。


大桥拓文:确实如此,深度学习技术用的很多都是人类的棋感,布局虽然很强,但是在围棋当中最重要的后半盘就稍微有些薄弱了。但是刚刚提到的星阵,用了很多技术,所以中盘之后的实力比其他AI要强。


白鸟士郎:虽说是深度学习,但是中后盘很强,这样岂不是无敌了?


大桥拓文:虽说都是深度学习,但是也有很多种类,星阵就是克服了这个问题,所以就达到了很难让其他AI匹敌的高度。


相较于AlphaGo Zero完全就是通过自我学习,将人类的领域知识组合起来让AI学习的话,或许作为围棋AI来说更强一些。


白鸟士郎:很抱歉,领域知识是什么?


大桥拓文:这个该怎么说呢,虽然不是规则,但是人类在下棋的时候需要考虑的地方。还有就是还有多少手棋就能吃掉这些棋,具体来说就是征子。


白鸟士郎:就是越下越到边上,然后最后全部被吃的棋型吗?



大桥拓文:Zero系的AI,其实是很不擅长征子的。还有就是两眼活棋吧,这也是AlphaGo Zero没有学过的东西。


白鸟士郎:在地盘上做出两只眼的话,就不会被吃掉了,这应该是围棋的基础中的基础吧。


大桥拓文:所以这些东西都是通过自我学习,这就是Zero系的AI。然后Zero系也需要花费很多学习资源,所以说这些我们还是先给他们准备一下的。


白鸟士郎:不过从开发的角度出发,感觉有一些向后退的样子。毕竟在没有用任何人类知识的情况下,变得这么强的。


大桥拓文:我觉得不是那样。刚开始AlphaGo出来的时候,人类还非常绝望地觉得:“人类之前建立起来的所有东西都白费了啊”。但是AlphaGo Zero的厉害之处,就是延伸出了Alpha Star、Alpha Ford等大众化的东西。


既然能让专业的围棋AI提升实力,那么让深度学习技术更有效率,通过人类辅助的AI,才能发展到目前的高度。


白鸟士郎:原来如此。


大桥拓文:还有一个敏感的问题就是,我觉得“深度学习的AI中后盘比较弱”的原因,归咎于“提供的数据本来就是不怎么会下中后盘的,所以中后盘就变差了”。


白鸟士郎:确实有道理。中后盘不太行的深度学习AI,让他们进行自我学习的话,中后盘也就必然变差了。如果根据原来的数据学习的话,再怎么下下去也都是差劲的。


大桥拓文:星阵和Katago,刚开始都是教他们该领域的知识之后,开始进行自我学习。而他们的中后盘,正是从实力强劲的数据中渐渐变强得来的。所以这应该就是他们强大的原因了。


而AlphaGo Zero用了实力突破了瓶颈。用了40b的大量TPU。


白鸟士郎:(又出现了我不会的术语),这个b是,数量越大就越厉害吗?


大桥拓文:是的,这个是模拟了人类大脑的神经网络的大小。块数越多,就越聪明。所以就觉得数字越大就越强,但是星阵的开发者好像并不认同这个观点(笑)。




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

徽帮棋友会 ( 苏ICP备2022041640号-1

GMT+8, 2024-11-12 16:38 , Processed in 0.224707 second(s), 20 queries .

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表