纳什均衡
奥斯卡获奖影片《美丽心灵》的主人公原型约翰·纳什在20世纪50年代提出“纳什均衡”理论,又称为非合作博弈均衡,保证使得同一时间内每个参与者的策略是对其他参与人策略的最优反应。在这一策略里,只要其他玩家的策略保持不变,单一玩家就无法通过变换策略获益。Libratus要做的就是识别没有希望的策略,从而更快地找到纳什均衡点。经过反复的训练后,Libratus就能够忽略那些糟糕的路径。
成都商报:你之前预计到会赢吗?
布朗:就在去年,我们大学设计的一个德州扑克人工智能程序在与人类的比赛中输得很惨。因此在这次的比赛中,博彩公司给我的Libratus能赢的赔率只有20%。我之前与人类高手有过测试,Libratus做得很好。但是人类玩家很善于找到机器玩家的弱点,因此如果我们在比赛中展现出任何弱点,就会被人类抓住。尽管Libratus的玩牌风格异于人类,但通过一天的比赛,顶尖人类高手仍可能识别出Libratus的一些“套路”,并加以利用。每个比赛日结束后的夜晚,我们都要找出并清除掉这些“套路”,不给人类任何可乘之机。
成都商报:那么Libratus有弱点吗?
布朗:当然有。Libratus玩的仅仅是双人版单挑无限额德州扑克。玩家增多会大大增加游戏的复杂性。因此,计算机还需要几年时间才能够对抗四个或更多玩家。
Libratus与AlphaGo哪家强
期待与谷歌合作 争取1+1>2
成都商报:阿法狗已经两次挑战人类高手了,你们今后还会再次上阵吗?
布朗:不会了,Libratus玩德州扑克的历史永远地结束了,它退休了。而我希望博士毕业后能继续留在学校从事科研工作。
成都商报:同样是人工智能与人类玩家大战,你如何评价阿法狗团队?你觉得阿法狗和Libratus的设计哪个更强?
布朗:我只能说,如果阿法狗(AlphaGo)与Libratus下围棋,Libratus肯定输;而阿法狗与Libratus打扑克,阿法狗肯定输。我希望在未来,我能与谷歌的DEEPMIND团队合作,将两个人工智能程序做个合并和合作,以获得1+1大于2的效应。阿法狗是人工智能的一个伟大的里程碑。阿法狗和Libratus各自在不同的领域取得了震惊世界的成绩,我们将为人工智能在未来发展的多个领域贡献自己的力量。
成都商报:我之前采访过阿法狗团队,我给他们的最后一个问题是“你们的最终目标是什么”,他们表示希望能将技术应用于解决现实世界的难题。如今,我将同样的问题抛给你。
布朗:Libratus与德州扑克的故事结束了,但是它在其他领域的尝试才刚开始。Libratus始终以自己的方式思考和操作,它最大的意义是科技让人工智能能够把握未知领域。这对于人工智能应用于现实生活领域至关重要。我希望它将来能够应用在金融谈判、拍卖、互联网安全等领域,这些领域都需要人工智能内在“不完美信息”的情景中做出决策,这也正是Libratus擅长的。
Libratus前景无限
美国《Wired》杂志给予布朗的Libratus极高的评价,Libratus 的确是个里程碑,展示一种新型人工智能,从华尔街交易到网络安全乃至拍卖和政治谈判,这种人工智能都可以扮演特定的角色。Libratus的下注非常随机化,甚至超过人类最强玩家的水准,如果这个方法不奏效,布朗晚上给出的演算法会弥补不足。金融市场交易员也可以采取相同做法,外交官亦然。这是一个强大且相当令人不安的想法:机器可以用豪赌吓退人类。
麻将是人类最后堡垒?
1979年,人类首次在西洋双陆棋游戏(backgammon)中败给机器。1997年,国际象棋第一人卡斯帕罗夫输给IBM的深蓝。当时他评论说,可以感觉到对手是种新的智能形式。
过去20多年,国际象棋、中国象棋、拼字游戏、围棋……人们心情复杂地见证了人工智能步步攻陷人类智慧的堡垒。两度出手皆获胜的“阿尔法围棋”,是要培养人工智能基于复杂信息的决策能力。一盘围棋游戏约有10的170次方个决策点,是所有棋类游戏中最多的,需要具有极大计算能力的人工智能,通过预测所有未来步骤的胜率来决策。
围棋是一种“完美信息”博弈,信息完全公开,玩家可以看到棋盘上的棋子,并预测落子可能性。而德州扑克玩家手中的底牌是其他玩家看不到的,因此是“不完美信息”博弈,要求更复杂的推理能力,对人工智能更具挑战。
当扑克也被攻陷后,人类最后的堡垒在哪?网友们依然不服输:有本事就来跟我打麻将。
诚然,麻将是一种运气成分占比非常高的竞技棋牌项目,技艺再强的高手,也有输给菜鸟的可能性。但同时不可否认的是,麻将中“技艺高低”也是明显存在的。即使是顶尖高手,日本竞技麻将的高手中,在经过大量场数的竞技之后,顶尖选手之间的分数差距,同样可以稳定地被拉开,竞技水平将被显著地区分开来。所以在麻将领域,研究出一个具有极高竞技水准的人工智能,是完全有可能的。
相比于棋类人工智能,麻将人工智能的策略则更多地增加自己得点的期望值,尽量让自己有更大的可能性和大牌,同时尽量避免为对手的大牌点炮。而麻将的打牌策略,显然是有最优解的。也许,未来的有一天,你也可以和麻将人工智能来一盘“血战到底”。
原标题:AlphaGo之后Libratus又来了 人工智能攻陷德州扑克