主页 / 社会 > 文娱 > 正文

人工智能再次碾压人类玩家 在《星际争霸2》游戏中完胜

2019-01-26 02:56:18   来源:科技生活在线   评论:0   [收藏]   [评论]
导读:小编按:1月25日凌晨,DeepMind与暴雪在网上直播,公布了在《星际争霸2》游戏中取得的进展,名为“AlphaStar”(阿尔法星际)的人工智能在与两位人类职业选手“TLO”和“MANA”的比赛中,均以5比0取胜。人工智能再次“碾压人类”。

  1月25日凌晨,DeepMind与暴雪在网上直播,公布了在《星际争霸2》游戏中取得的进展,名为“AlphaStar”(阿尔法星际)的人工智能在与两位人类职业选手“TLO”和“MANA”的比赛中,均以5比0取胜。人工智能再次“碾压人类”。

  由于《星际争霸2》是公认的策略极其复杂的游戏,DeepMind在这个游戏中取得的成绩被认为是有一个人工智能领域中里程碑式的事件。

  “这又是一个非常有意思的进展,DeepMind确实很厉害,令人佩服。” 中国科学院计算技术研究所陈云霁研究员对第一财经记者表示。陈云霁爱打星际争霸,也密切关注DeepMind在人机大战方面的进展。他表示:“场景边界明确、规则明确的领域,机器迟早都能战胜人类。”

  去年8月,DeepMind和游戏公司暴雪(Blizzard)宣布合作发布一项叫做SC2LE的工具,希望能够加速人工智能在实时策略游戏《星际争霸2》中的研究。DeepMind当时表示:“我们的目标是不断扩大人工智能的边界,开发能够解决复杂问题的系统。为了实现这一目标,DeepMind实验室设计了一系列的机器人特工,并测试他们在不同环境下的能力,让他们去玩一些人类玩了几十年的游戏。打败人类不是我们设计的最终目的,但这对于对标机器人的性能非常重要。”

  此前DeepMind在围棋项目AlphaGo中战胜柯洁和李世石,一度引起人工智能界的轰动。DeepMind在克服了很多技术上的难题之后,“AlphaStar”正式诞生,并开始与人类职业选手的测试。

  AlphaStar跟AlphaGo有些类似,最开始都是通过学习人类选手的Replay(比赛录像)来提升水平。直播中展示的10场比赛都是在一张相同的比赛地图上进行,并且人工智能的APM(每分钟操作的次数)限制在与人类选手相仿的程度。

  人工智能医疗企业珠海医凯电子科技有限公司技术团队负责人张国峰对第一财经记者表示:“人工智能对付游戏确实非常有效,因为游戏是人类设计的有限规则环境,即便它再复杂也是有限的规则,永远没有‘意外’。在这种环境之下的对弈,人工智能的响应速度和判断参数要全面优于人类。因此AI在很长一段时间的未来,在可控的有限规则环境下,将全面取代人类,比如工厂生产等。”

  然而,现实世界在大多数情况下都是无限的规则环境,比如安防或者无人驾驶。以无人驾驶为例,目前大多数的无人驾驶都仍然处于全封闭的道路测试阶段,而如果放开至开放道路,则将面临更多的不确定因素。

  张国峰认为,即便是在无限规则环境之下,人工智能也将对人类起到非常大的辅助作用。人类的智慧将被大大解放,仅仅使用在需要突破和创新的领域,而不用去做简单重复的劳动。“人类智能的特点是发现新事物,创造新方法。”张国峰对第一财经记者表示,“比如在游戏中,当人类玩家在通过技能无法战胜对手的情况下,就会想出‘旁门左道’,用诸如网络攻击等方法使得对方down机来获胜,这是AI无法做到的。”(第一财经)
 

  链接+

  阿法狗“同门”AI完爆《星际争霸2》,阿法星10比1吊打人类

  北京时间1月25日凌晨2点,备受关注的阿法狗团队AI打《星际争霸2》游戏之事如期展开。直播现场,人类职业选手在比赛中获胜。不过,根据赛前播放的视频显示,自2018 年 12 月 10 日以来,DeepMind的AI已经10次在《星际争霸2》中战胜人类职业选手。

  直播现场人类取胜

  1月25日凌晨2点,英国知名的人工智能企业、阿法狗AlphaGo研发团队DeepMind通过线上直播的方式,向全世界的游戏 AI 研究人员以及游戏爱好者们介绍自己的 AI 研发最新进展——名为AlphaStar的AI。

  现场首先播放了2018 年 12 月 10 日以来,AlphaStar与电竞战队Team Liquid的选手TOL与MaNa进行对战的比赛录像。结果出乎外界意料的是,AlphaStar以两个5:0的分别击败了TOL与MaNa。

  在随后直播现场,MaNa战胜了AlphaStar,将此次人机大战的比分定格在10:1。值得一提的是,MaNa是2018 WCS Austin比赛的亚军,代表着目前《星际争霸II》职业选手的顶尖水平。

  业内:相比操控,AI运营能力值得关注

  由于信息不对称、玩法复杂繁琐、策略瞬息万变等特点,让外界看来《星际争霸II》或许是人类在游戏领域人机对战最后一块“遮羞布”。

  “星际争霸作为当前难度最高的即时策略游戏,首先存在‘战争迷雾’机制,使得AI无法得知未探索区域玩家现阶段在布置何种战术,因此无法做出最优选择。“国内顶尖职业玩家TIME赛前曾向南都记者表示,游戏中的资源控制、升级顺序、种族与兵种间的互相等种种游戏细节,需要操作者对游戏平衡性有较为深刻的了解。

  直播现场,DeepMind团队向外界介绍,他们通过回放了大量人类玩家游戏时的视频,对AlphaStar进行深度训练,让AI通过观察一个人所处的环境,尽可能地模仿某个特定的动作,理解游戏基本知识。

  之后,团队使用了一个称为“Alpha League”的方法,从人类数据中训练出来的神经网络进行对抗,期间进行迭代与产生新的Agent(注:“智能体”、“代理人程序”,计算机术语)和分支,而Agent通过强化学习过程与“Alpha League”中的其他竞争对手进行对抗,积累面对不同的策略的经验,并从中最不容易被利用的5个Agent,命名为“the nash of League”,参与与人类职业选手的对抗。

  DeepMind团队公布的视频显示,AphlaStar对上第一个职业选手TLO,为Liquid战队的“虫族”选手,目前世界排名第68。

  由于规则设定,TLO只能使用“神族”,这对他的实力是有较大的约束的,而比赛他也是以5:0的比分落败。其中,AphlaStar的游戏操作十分亮眼。在接送、点残血、后退、骚扰等游戏细节和操控上,AphlaStar都游刃有余,有相关人士分析道,“AphlaStar在控制众多单位时对攻击距离的把握相当精确,这在游戏职业玩家中都算是比较极限的操作了,而AI能够较为轻易的是用出来”。

  正是因为拥有强大的操控能力,使得AphlaStar能够精确的控制30个中级兵种单位的对抗MaNa手中的高级兵种单位,实现“以下克上”的效果,这在以往职业赛场是十分罕见的。

  有专家表示,相比于游戏操作,更值得关注是AphlaStar的运营能力。在之前与MaNa的比赛视频中,AphlaStar方面不断的派着兵去骚扰MaNa基地,干扰对方发展,以至于AphlaStar经济常常是领先的。

  目前短板:局势判断和应变能力

  “其实AI完成微操并不难,只要进行相对应的神经网络算法与强化学习,大部分AI都能达到。”有人工智能专家告诉南都记者,难就难在AI在大局观上与决策上,目前缺少一定的游戏局势判断和应变。

  这种不足在MaNa与AphlaStar的现场对决中便显现出来。虽然此前MaNa同样以5:0的比分输给了AphlaStar,但是现场对决上MaNa则是拿捏到了AphlaStar的“命脉”。

  虽然AphlaStar在运营能力与操作水平都占据上风,但是MaNa还是通过骚扰战术,让AlphaStar数十个单位的“追猎”来回往返前线和家中,逼迫后者陷入循环执行某种任务的怪圈,让其无法形成有效的局势判断,而最后MaNa通过强大的兵力压制,获得了胜利。

  从“菜鸟”到“大师”,仅用两年时间

  此前,2016年3月的WCS中国区总决赛上,暴雪娱乐制作总监Tim Morten就曾确认DeepMind的AI将挑战《星际争霸II》的消息。

  不过,到2017年8月,DeepMind方面曾表示,AlphaGo还无法像人类一样同时处理多种事物,《星际争霸II》等即时策略类的游戏的操作空间太大。AI对其探索还处在非常早期的阶段,不仅需要训练各种“常识”,而且在面临突发情况时的应变能力也有所不足。

  在2018年11月暴雪方面提到DeepMind的《星际争霸II》AI进展时,表示:“一旦人工智能模型掌握游戏的基本规则,它就可以开始进行如带农民Rush开局等有趣的行为。此外,在与“疯狂”难度的《星际争霸II》的AI模型对阵的时候,获胜概率可以达到50%。”不过,有职业选手曾对南都记者表示,“疯狂难度”的人机强度不大,“我们平时训练都用不上,对上它的胜率也接近100%。”

  只用了短短两年时间,AI技术便在对抗人类职业选手中取得优势。

  “我们正在试图理解人类以及我们大脑的工作方式。”暴雪首席软件工程师Jacob Repp向外界传达他们行为背后的逻辑,“如果我们能够得到这种高质量的数据流——人类玩游戏时的原始输入以及由此产生的结果——那就能成为研究人们行为的有用数据。”(南方都市报)

分享到:
责任编辑:admin

网友评论

全站最新