人工智能系统已经变得越来越适合于棋盘游戏

时间:2020-06-23 15:04:08来源:
导读从Turochamp到DeepBlue,数十年来,人与计算机的竞争吸引了众多观众,并在此过程中引发了大量夸张的言论。近年来,人工智能(AI)系统在各种

从Turochamp到DeepBlue,数十年来,人与计算机的竞争吸引了众多观众,并在此过程中引发了大量夸张的言论。近年来,人工智能(AI)系统在各种经典游戏中占据了上风。人工智能研发公司DeepMind在创新的前沿一直支持着其中许多系统。

2016年3月,DeepMind的AI系统AlphaGo与围棋传奇以及18次获得世界冠军的车手李·塞多尔(Lee Sedol)争分夺秒。随着全球成千上万的调整,不可思议的缓慢发展逐渐展开,AlphaGo可以说是过去十年中以外科手术的精确度脱颖而出的抽象战略棋盘游戏的最佳参与者。令人惊叹的AlphaGo胜利使AI系统获得了9 dan的排名,是此类认证中最高的。

现在,该公司将目光投向了一个人工智能代理,以培训人类另一个神秘的棋盘游戏。这次尝试外交。毕竟,我们培训AI掌握全球谈判技巧的谈判技巧只是时间问题。

与其他基本游戏不同,外交涉及复杂的策略和方案。例如,在像跳棋这样的游戏中,玩家对于在任何给定时间将单个棋子移到何处的决定相当有限。当然,棋类的细微差别和复杂性会增加,因为玩家必须为棋子分配价值并精心设计一系列连贯的棋步才能获得成功。在深奥的棋盘游戏世界中,外交对人工智能提出了自己的挑战。汲取教训

“外交有七个参与者,面对其他行动者的不确定性,他们专注于建立联盟,谈判和团队合作。因此,行动者必须不断地推理出与谁合作以及如何协调行动,”汤姆·埃克斯尔斯(Tom Eccles)说。 DeepMind的研究工程师。

事实证明,在象棋和围棋这样的零和游戏中,人工智能系统甚至远远胜过最优秀的人类。在这种类型的游戏中,只能有一个赢家和一个输家。与此不同,外交要求特工建立联盟并促进协作。

“一方面,在没有其他玩家支持的情况下很难在游戏中取得进展,但另一方面,最终只有一个玩家可以获胜。这意味着在这种环境下实现合作更加困难。外交中合作与竞争之间的矛盾使在这场比赛中建立可信赖的特工成为一项有趣的研究挑战,” DeepMind研究科学家汤姆·安东尼说。

在零和游戏中迅速击败人类玩家的能力无疑令人印象深刻,但是,更丰富的技能层次为AI潜力开辟了另一个世界。我们的日常生活涉及错综复杂的平衡协同作用。我们的个人需求通常是在更大的团队努力下进行的。也就是说,这项研究可以增强代理商与我们之间以及彼此之间进行协作的能力,从而导致大量实际应用。

“在现实生活中,我们经常团队合作,必须竞争和合作。从简单的决定(例如安排会议或决定与朋友一起吃饭的地方)到复杂的决定(例如与供应商或客户进行谈判或分配任务),作为一个联合项目,我们一直在思考如何与他人最好地合作。随着AI系统变得越来越复杂,我们有必要为他们提供更好的工具来与他人有效地合作。”研究科学家Yoram Bachrach说道。在DeepMind。

最新文章