来自未来的AlphaGo

2017-06-15 01:20江铸久

三联生活周刊 2017年24期

不远的将来，基因分析师以及分析基因数据的软件会变得热门，遗传学会日益进入医疗保健领域……你的病就像你的个性一样，独一无二，并且被单独对待。

上世纪90年代初，我刚到美国时就接触了围棋人工智能。我和开发它们的工程师们每年会见上几次面，给他们出出主意、提点建议。那个时候的人工智能有点像牛车，缓慢而坚定地前行着，虽然可以清楚地看到它们的进步，但是感觉还是离我们很远很远……

大约10年前，我到加拿大班芙参加了一个数学家与IT人士的国际性年会。参加会议的都是这方面的专家，只有我一个人是纯粹的棋手。目前世界上有大约6000种智力游戏（包括所有的棋类、牌类，还有许许多多我们想也想不到的玩意儿），但是，只有围棋，还坚守着人类的防线，其他的都已经完全被电脑攻克了。我亲眼看到有人拿来一种新发明的游戏，只需一夜的时间，就一定会有人写出破译的程序。到了第二天，人就玩不过电脑了。但是大家都在感慨，围棋太难了，太多变化了，电脑算不过来啊！那时，我真为我们老祖宗的发明感到自豪。

慢慢地围棋的人工智能发展起来了，很多国家都有IT人士在研究与开发，各种围棋软件相继出现，实力也大大提高了。不过我们还是认为，人工智能要赶上人类还早，至少在我的有生之年，人类还是可以遏制电脑的吧！

2016年1月27日，谷歌在《自然》（Nature）杂志发表论文，介绍了DeepMind团队开发的AlphaGo，以及它5∶0战胜欧洲冠军樊麾的消息和棋谱。

（左至右）江铸久、芮乃伟、DeepMind AlphaGo研发专家索尔·格雷佩尔和技术负责人席尔瓦在今年5月举行的乌镇围棋峰会上

我注意到，在对樊麾的棋谱中，它展现出很强的实力。不过，当时的围棋界还是比较乐观的，大家认为从棋谱看，电脑是厉害了，但是没有厉害到可以和职业围棋的一流高手抗衡的地步。所以在AlphaGo和李世石的人机大战前，一般都预测李世石五盘全胜不成问题。

对于一直比较关注围棋人工智能进展的我来说，坦率地讲，对这次大战的人类方并不是那么有信心。看了AlphaGo对樊麾的五局棋谱，感觉电脑已经非常接近人类最高水平，尽管看上去它的很多招法还是有点拙，赢得也不多，但是电脑从来没有落过下风……没想到AlphaGo第一局就赢了，而且赢得非常漂亮，也没想到最后4∶1的结果，居然是李世石只赢了一盘。当然那是一盘伟大的胜局，李世石在形势不利的情况下弈出“神之一手”，引出了AlphaGo的bug。

从那次人机大战的整体看，AlphaGo下得漂亮。比如第二局黑37手的尖冲，令人荡气回肠，感觉是吴清源老师回来了。吴老师曾说“我200岁在宇宙中还要下棋”。那么，這是AlphaGo将吴老师的思想传递回来了吧？想及此点，我异常感动。

2017年新年AlphaGo再度出山，以Master的网名在各大围棋对弈网站下了60盘棋，全胜。这60局，中日韩一流棋手轮番上阵，棋风迥异的顶尖高手们和AlphaGo在盘上激烈碰撞，为我们留下了精彩的棋谱。

在对60局棋谱的学习中，我们迎来了乌镇围棋峰会，人机大战第二季，由当前世界围棋第一人、年轻的柯洁对战AlphaGo三番棋。

此次人机大战的胜负结果我觉得是没有悬念的，因为我仔细研究了Master的60盘棋（还写下打谱心得供孩子们学习），体会到了AlphaGo的强大。当然我们希望柯洁赢，但是我更关心的不是胜负，而是AlphaGo会不会带来一些更加神奇的、甚至是我们职业棋士也看不懂的招法，我期待着看到人机之间更加精彩的对抗。

5月23日第一局，柯洁执黑。AlphaGo每一步都出乎我们的意料。特别是白54断，真是惊世骇俗的一手，记得芮乃伟当时不住地念叨：“什么意思？这不是后手吗？”是的，是后手，但是这步棋，完全消去了黑势，又使空虚的白角变厚了……

当天我在接受采访时说，AlphaGo的亮点是下出了人类棋手的一个盲点，这充分说明了我们人类思维的局限性。从这盘棋学到很多东西，但是还不够过瘾，因为柯洁的黑棋有点拘谨，没有放开。而AlphaGo展示了它掌控局势的能力，布局阶段的一点优势后慢慢推进，平稳地走向终点。第二盘棋，非常期待柯洁展现出自己的风格，希望看到他逼出AlphaGo的最佳表现。

在24日的论坛上，DeepMind CEO哈萨比斯（Damis Hassabis）和AlphaGo技术负责人席尔瓦（David Silver）的讲座非常精彩，令观众了解了AlphaGo是如何依靠它的策略网络和价值网络进行剪枝和判断的。但是最令人震撼的是席尔瓦先生在讲话中说，AlphaGo Master（是年初在围棋网上60连胜的版本，此次对阵柯洁也是同一版本）经过这一段的深度学习，已经比同李世石下棋时的版本进步了Three Stones。三子啊！听到这个说法，柯洁立刻在微博上发表了“天呐”的感叹。

本来现在职业与业余之间的距离都非常小，三子得是多大的差距啊！真是有点难以置信。午餐时我们特地找哈萨比斯先生求证。哈萨比斯先生首先肯定了这Three Stones就是三个子，而不是三目（Three Points），然后解释说这是系统自己测定的，按照“AlphaGo李”同“AlphaGo柯”自己对下时的结果估算出的实力差距，不说明和人类下也能让三子。不过，他又补充了一句：“也许是让两子……”

嗯，这也已经足够令人震惊了。想起今年3月份到日本的时候，碰到了武宫正树老师、赵治勋老师和小林光一老师，他们都不约而同地认为如果是60局连胜，按照棋份来说，那是两个子的棋份了。

25日第二局，一开始似乎柯洁小有不顺，但是他及时停住，转战下方，在进入中盘后成功地把AlphaGo拖进了一场乱战之中，这是柯洁最擅长的局面，可以尽情发挥自己的特长，感觉柯洁似乎放开了，拼命了，下得非常出色，可以说是逼AlphaGo使出了浑身解数。据赛后公布的数据，AlphaGo认为前100手是双方最善。虽然后半盘柯洁弈出问题手，棋局戛然而止，但是那一局棋，令许许多多的观众热血沸腾。

27日第三局，柯洁前半盘弈出问题手，之后奋力拼搏，一度使形势非常接近，但后半盘还是AlphaGo掌控了局势。我觉得，到了这时候，胜负更不重要了（当然对柯洁仍然是重要的），我们最期待看到的是他们两个下出什么样的棋，盘上的内容有多精彩，这一点，我想大家都没有失望。

去年，李世石与AlphaGo大战之后，我发表文章说：“李世石并没有输给机器，而是输给了人类创造出来的高科技。”今天的柯洁也是如此。他做了最大的努力，我们为他鼓掌。

这次现身乌镇的AlphaGo，在深度学习、硬件并行加速，以及搜索算法的优化方面都有长足的进步。曾经听说，DeepMind要训练一个完全没有人类棋手痕迹的版本，事实不是这样的。确切地说，是在学习了人类棋手的大量棋局的基础上，再进行完全的自我对弈训练的。也就是说，达到一个高度后，他只需要自己克隆自己，昨天的自己就是今天最好的對手。AlphaGo的运行原理是遇强则强，我觉得，它就像一面镜子，能够反照出最好的那个你。

赛后的新闻发布会上，哈萨比斯先生宣布AlphaGo将退出围棋赛事！也就是说，AlphaGo将退出江湖，从现在起只给我们留下背影。DeepMind团队同时宣布，将陆续公布AlphaGo互搏的50局棋谱。今天先公布10局，我看了几个片段，那真的是有着许多可以颠覆围棋观的内涵啊，谷歌的武功秘籍公开了。

非常感伤，一段传奇真的就这样离开了吗？

回味这场“绝唱”，在传承方面，AlphaGo吸收了很多前辈高手的精华并予以再创造。在棋局中，我看到它的很多招法有当年吴清源老师的影子，心里非常感动。也许，上天是通过AlphaGo映照出了很多职业棋手在历史上那些让人难忘的场景，那些可歌可泣的精神。我相信，无论科技进步到哪一层面，人类文明的精神、围棋的精神是永远值得我们景仰和致敬的。

我们要向DeepMind团队致敬，他们创造了奇迹。仅仅三年，AlphaGo就打败了人类几千年的进化。AlphaGo团队的黄士杰博士说：“我看见了人因梦想而伟大的真实意义。”我想，我们职业棋士是幸运的，在这个科技突飞猛进的时代，我们能够看到超越人类极限的美好。仰望星空，来自未来的AlphaGo带给我们更加广阔而自由的视野。