全搜索首页 新闻 视频 图片网 更多» 专题 评房网
新闻首页  »  国内国际  »  正文

输给围棋人工智能 樊麾:昏招都被它抓到了(2)

2016-01-29 09:41   来源: 华西都市报   编辑: 曾俊菠   责任编辑: 马兰

战传奇

阿尔法可能隐藏实力

李世石迎战:有信心获胜

100万美元史上最高围棋赛奖金!3月8日至15日李世石九段将与谷歌围棋AlphaGo在首尔进行人机大战,胜者奖金高达100万美元。据悉谷歌围棋如获胜将捐赠奖金。李世石欣然应战,表示有信心获胜。

英国时间27日下午6点,位于伦敦的谷歌旗下人工智能研究机构DeepMind在世界顶级学术杂志《自然》发表了关于围棋人工智能项目的论文,顿时成为业界焦点。阿尔法在堪称人工智能难关中的皇冠——围棋项目中达到了里程碑的成绩,被誉为开创了人工智能的新纪元。谷歌围棋论文中公布了AlphaGo与樊麾的5局棋谱,有韩国棋手品过之后认为AlphaGo棋风很沉着,在局部的次序和战斗与众不同,按棋谱显示的实力,目前最顶尖棋手能让其2至3子。但由于对局是去年10月进行的,谷歌方面或许有意隐藏实力,AlphaGo有可能已达到职业五段水平。

谷歌围棋随即向顶级职业棋手李世石发出挑战,比赛预计3月8日至15日在首尔举行,胜者奖金高达100万美元,相关的记者发布会稍后会在“谷歌韩国”举行。

欣然应战的李世石表示,很荣幸能与谷歌人工智能围棋对决,感到非常高兴。这是围棋史上的重要比赛,所以接受挑战,并且有信心获胜。

看好谁

李世石可能比阿尔法强在哪?

人类围棋的最高水平比计算机高明在哪?其实就在于一些定式、死活、对杀计算这些“实”之外的一些“虚”的东西。

以李世石与朴廷桓名人战决赛第4局的较量为例,李世石在白1托右下角的时候出人意料地选择脱先2位尖,着实令人感到匪夷所思。我们不去评价这手棋是不是棋盘上最佳的一手,这手棋的关键在于很多隐藏的意图。计算机可能会通过棋型判断左边的黑棋会不会有安全问题,如果没有断然不会自补一手,而是思考右下局部如何应对,但李世石为何下这一手呢?1加强了左边黑棋的,2瞄着下边的冲断,3瞄着侵消左边白棋,4瞄着将来或许可以攻击上边的白棋。这几个意图在这一手落下之后便不再神秘,但在落子前这些信息是完全隐藏的。

如何发现这些隐藏的信息、意图以及做出选择之前全方位的模糊价值判断,才是计算机攻克这次瓶颈的关键所在。然而,一旦突破之后,恐怕围棋人工智能将不可阻挡。

人类发明了汽车,跑得比人快得多。发明了船和潜艇,也比人更能驾驭江河湖海。发明了飞机征服了天空。现在,人类发明的计算机正在展开智能领域的凶悍攻势,围棋或许是人类最后的堡垒。3月AlphaGo与李世石史无前例的人机大战,您看好谁?

众说

上海围棋队主教练刘世振:“之前的顶级围棋AI棋力基本维持在业余五段的水平。有职业围棋选手参与的人机大战,一般都会让电脑五个子左右。在我看来,今年3月,李世石取胜没有悬念。”

《自然》杂志:“人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。”

世界冠军柯洁:“这一次,谷歌悬赏一百万美刀与李世石下,只能说李世石运气太好。以现在这个计算机的实力战胜李世石的可能性不到5%。”

脸书CEO扎克伯格:在过去六个月中,我们已开发了一个人工智能系统,代号为Darkforest。它走棋的速度很快,每隔0.1秒就能走一步棋。我们已经快要成功了。

揭奥秘

“深蓝”之后,人类最后的智力骄傲要洗白?

这是人类历史上,围棋AI第一次在公平比赛中战胜职业选手。

1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。

阿尔法的必杀技:机器学习

曾预言

计算机围棋赢人类需要10年

至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。

英国围棋协会主席乔恩·戴蒙德表示:“这场比赛之前,我曾预计,计算机程序能够击败人类顶级围棋选手,起码要等到5至10年后。”

谷歌的研究者们祭出了终极杀器——“深度学习”。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。

训练AI

自己跟自己下棋棋力更精进

人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以阿尔法只要经过了足够的训练,就能击败所有的人类选手。

研究者们用许多专业棋局训练AI,这种方法称为监督学习,然后让AI和自己对弈,这种方法称为强化学习,每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!阿尔法的核心是两种不同的深度神经网络。“策略网络”和“值网络”。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

真优势

推算20步内哪里下子赢面大

“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。利用蒙特卡洛拟合,将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。阿尔法利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

本组稿件综合新华社、央视、《参考消息》等

原标题:昏招都被它抓到了

上一页 1 2下一页

网友跟帖仅表达其个人看法,并不表明全搜索同意其观点或证实其描述。

请理性评论、文明发言,勿发布违法和损害公序良俗的信息。我们将不予发表或删除可能引发法律纠纷和损害公序良俗的信息。


今日推荐