输给围棋人工智能樊麾：昏招都被它抓到了（2）_国内国际_新闻首页

战传奇

阿尔法可能隐藏实力

李世石迎战：有信心获胜

100万美元史上最高围棋赛奖金！3月8日至15日李世石九段将与谷歌围棋AlphaGo在首尔进行人机大战，胜者奖金高达100万美元。据悉谷歌围棋如获胜将捐赠奖金。李世石欣然应战，表示有信心获胜。

英国时间27日下午6点，位于伦敦的谷歌旗下人工智能研究机构DeepMind在世界顶级学术杂志《自然》发表了关于围棋人工智能项目的论文，顿时成为业界焦点。阿尔法在堪称人工智能难关中的皇冠——围棋项目中达到了里程碑的成绩，被誉为开创了人工智能的新纪元。谷歌围棋论文中公布了AlphaGo与樊麾的5局棋谱，有韩国棋手品过之后认为AlphaGo棋风很沉着，在局部的次序和战斗与众不同，按棋谱显示的实力，目前最顶尖棋手能让其2至3子。但由于对局是去年10月进行的，谷歌方面或许有意隐藏实力，AlphaGo有可能已达到职业五段水平。

谷歌围棋随即向顶级职业棋手李世石发出挑战，比赛预计3月8日至15日在首尔举行，胜者奖金高达100万美元，相关的记者发布会稍后会在“谷歌韩国”举行。

欣然应战的李世石表示，很荣幸能与谷歌人工智能围棋对决，感到非常高兴。这是围棋史上的重要比赛,所以接受挑战,并且有信心获胜。

看好谁

李世石可能比阿尔法强在哪？

人类围棋的最高水平比计算机高明在哪？其实就在于一些定式、死活、对杀计算这些“实”之外的一些“虚”的东西。

以李世石与朴廷桓名人战决赛第4局的较量为例，李世石在白1托右下角的时候出人意料地选择脱先2位尖，着实令人感到匪夷所思。我们不去评价这手棋是不是棋盘上最佳的一手，这手棋的关键在于很多隐藏的意图。计算机可能会通过棋型判断左边的黑棋会不会有安全问题，如果没有断然不会自补一手，而是思考右下局部如何应对，但李世石为何下这一手呢？1加强了左边黑棋的，2瞄着下边的冲断，3瞄着侵消左边白棋，4瞄着将来或许可以攻击上边的白棋。这几个意图在这一手落下之后便不再神秘，但在落子前这些信息是完全隐藏的。

如何发现这些隐藏的信息、意图以及做出选择之前全方位的模糊价值判断，才是计算机攻克这次瓶颈的关键所在。然而，一旦突破之后，恐怕围棋人工智能将不可阻挡。

人类发明了汽车，跑得比人快得多。发明了船和潜艇，也比人更能驾驭江河湖海。发明了飞机征服了天空。现在，人类发明的计算机正在展开智能领域的凶悍攻势，围棋或许是人类最后的堡垒。3月AlphaGo与李世石史无前例的人机大战，您看好谁？

众说

上海围棋队主教练刘世振：“之前的顶级围棋AI棋力基本维持在业余五段的水平。有职业围棋选手参与的人机大战，一般都会让电脑五个子左右。在我看来，今年3月，李世石取胜没有悬念。”

《自然》杂志：“人类在下棋时有一个劣势，在长时间比赛后，他们会犯错，但机器不会。而且人类或许一年能玩1000局，但机器一天就能玩100万局。”

世界冠军柯洁：“这一次，谷歌悬赏一百万美刀与李世石下，只能说李世石运气太好。以现在这个计算机的实力战胜李世石的可能性不到5%。”

脸书CEO扎克伯格：在过去六个月中，我们已开发了一个人工智能系统，代号为Darkforest。它走棋的速度很快，每隔0.1秒就能走一步棋。我们已经快要成功了。

揭奥秘

“深蓝”之后，人类最后的智力骄傲要洗白？

这是人类历史上，围棋AI第一次在公平比赛中战胜职业选手。

1997年，国际象棋AI第一次打败顶尖的人类；2006年，人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石，在电脑面前终于一败涂地，应了四十多年前计算机科学家的预言。

阿尔法的必杀技：机器学习

曾预言

计算机围棋赢人类需要10年

至少还有东方，人们自我安慰道。围棋AI长期以来举步维艰，顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理：国际象棋中，平均每回合有35种可能，一盘棋可以有80回合；相比之下，围棋每回合有250种可能，一盘棋可以长达150回合。这一巨大的数目，足以令任何蛮力穷举者望而却步——而人类，我们相信，可以凭借某种难以复制的算法跳过蛮力，一眼看到棋盘的本质。

英国围棋协会主席乔恩·戴蒙德表示：“这场比赛之前，我曾预计，计算机程序能够击败人类顶级围棋选手，起码要等到5至10年后。”

谷歌的研究者们祭出了终极杀器——“深度学习”。深度学习是目前人工智能领域中最热门的科目，它能完成笔迹识别，面部识别，驾驶自动汽车，自然语言处理，识别声音，分析生物信息数据等非常复杂的任务。

训练AI

自己跟自己下棋棋力更精进

人类在下棋时有一个劣势，在长时间比赛后，他们会犯错，但机器不会。而且人类或许一年能玩1000局，但机器一天就能玩100万局。所以阿尔法只要经过了足够的训练，就能击败所有的人类选手。

研究者们用许多专业棋局训练AI，这种方法称为监督学习，然后让AI和自己对弈，这种方法称为强化学习，每次对弈都能让AI棋力精进。然后他就能战胜冠军啦！阿尔法的核心是两种不同的深度神经网络。“策略网络”和“值网络”。它们的任务在于合作“挑选”出那些比较有前途的棋步，抛弃明显的差棋，从而将计算量控制在计算机可以完成的范围里，本质上和人类棋手所做的一样。

真优势

推算20步内哪里下子赢面大

“值网络”负责减少搜索的深度——AI会一边推算一边判断局面，局面明显劣势的时候，就直接抛弃某些路线，不用一条道算到黑；而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋，有些棋步是明显不该走的，比如不该随便送子给别人吃。利用蒙特卡洛拟合，将这些信息放入一个概率函数，AI就不用给每一步以同样的重视程度，而可以重点分析那些有戏的棋着。阿尔法利用这两个工具来分析局面，判断每种下子策略的优劣，就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下，就能判断在哪里下子赢的概率会高。

本组稿件综合新华社、央视、《参考消息》等

原标题：昏招都被它抓到了

网友跟帖仅表达其个人看法，并不表明全搜索同意其观点或证实其描述。

请理性评论、文明发言，勿发布违法和损害公序良俗的信息。我们将不予发表或删除可能引发法律纠纷和损害公序良俗的信息。