腾讯王者荣耀AI论文首次暴露：五AI王者局开黑与人类战队战平—量子位

时间:2023-04-14 08:47:29
浏览:0

王者峡谷可能马上就要被AI支配了！

腾讯根据刚刚发表的论文，王者荣耀AI在无言中，又掌握了新技能：组团开黑。而且战绩不俗。

5个各自独立的王者荣耀AI学会了黑技能之后，5v5与『王者荣耀』的王者段位人类玩家对战，战斗250游戏，一举获得48%的胜率，几乎成为平局。

真糟糕。

上个月，王者荣耀体验服开始了难度等级的人机练习模式测试。据说机器人只有白金级的水平，但一般认为很难打到一票大牛。

现在王者级AI出现了，问一下你怕不害怕。

王者荣耀AI的难度在哪里腾讯去年王者荣耀暗示着在做AI。

既有“明显”的说法，也有“隐藏”的说法。去年，“腾讯”高管透露围棋妙招，正在学习“王者荣耀”。

在最新的论文中，“腾讯”表明尽管“AlphaGo”是AI里程碑，但下围棋与现实世界相比是一个非常简单的问题。

更复杂的问题是实时战略（RTS）游戏，其中最受欢迎的分支是MOBA游戏，包括Dota、英雄联盟、王者荣耀等。

一套王者荣耀的平均时间为20分钟，相当于约2万帧。

围棋往往一局不超过361手。

在每个框架的屏幕上，需要在几十个选项中确定，包括24个方向的移动键、几个技能键、几个技能键和方向。经过大幅度的简化和离散化，即使响应时间增加到200ms，工作空间的数量级也是101500。

围棋的动作空间约为10250。

关于状态空间，王者荣耀地图的分辨率为130000×130000像素，每个英雄的大小为1000像素。每帧，每个英雄都有不同的状态。比如血量、等级、经济等。即使大大简化，状态空间仍为1020000。

总结如下表。两个单词：复杂。

王者局5v5的黑战绩闪闪发光，即使如此复杂，腾讯也取得了突破。

看看AI是怎么打农药的。

先看开局，这是最重要的阶段之一。下面四个注意力分布图代表了AI学会的不同开局策略。4张图从左到右依次是貂蝉（法师）、韩信（刺客）、亚瑟（坦克）、子孙（射手）

可见，AI貂蝉在开局阶段重点关注中路外塔，AI韩信关注我方上路野区青Buff，AI亚瑟和AI后代关注我方下路野区红Buff。没有被登记的第5个英雄AI宫本武藏，守护我方前往的外塔。

这就是王者荣耀的一般开局。

随着游戏的进行，AI对错位的注意力也逐渐发生变化。下面的图表显示，随着时间的推移，AI各英雄之间的动作会越来越近。

这个分工联动是此次王者荣耀AI的最大提高点。

说出结果。AI为了验证自己的实力，开始寻找人类进行练习。5个AI组队开黑，与人类玩家战斗5v5大战250局。最后，AI战队胜率达到48%。

这些玩家都是王者段位，属于人类玩家Top1%的部分。

腾讯论文指出，AI战队取得的人数比人类战队少15%，在推塔、团战率、经济获得方面，可与人类战队相媲美。

开局前10分钟，AI战队比人类战队多推2.5塔。10分钟后，由于团战能力较弱，双方推塔数逐渐接近。这一特点总结在腾讯中：AI在宏观战略的制定上，已经接近或优于人类达人。

王者AI背后的算法AI追逼人类王者，是什么手段造成的。

答案是基于学习的分层宏策略模型。经过这一模式的熏陶，驾驭每一位英雄代理，可以独立进行决策，不忘与队友沟通成为顶级球员。

名字中的“图层”是指该模型分为注意力图层（Attention Layer）和时期图层（Phase layer），前者用于预测英雄应该去哪里，后者用于预测游戏进行到哪个阶段、前期、负责识别是对线还是后期。

我们先看一下注意力层，也就是AI如何判断那个英雄应该去哪里。

为了培养这种能力，首先需要适当的训练数据，在王者荣耀中，我想判断英雄“来到了这里”，最合适的标准是“在这里战斗”。

因此，腾讯显示训练数据时，将下一次攻击发生的地方作为英雄现在应该去的地方。

例如，上图中以韩信为例，显示了游戏初期英雄应该去哪里。左侧显示初始阶段s-1的游戏状态，中央和右侧的红框显示的ys，ys+1显示韩信进行第1、2次攻击的位置，也就是s-1、s两个阶段应该去的位置。

AI的目标是在s-1阶段准备去y位置，在s阶段学习去ys+1位置。

通过使用这样的数据训练注意力层，可以让AI掌握英雄移动的奥秘。

知道该去哪里也不够，要想成为王者，就要判断形势调整战略。这是时期层的工作。

我想知道游戏是进行到前期，是对线期还是后期，光是时间当然不够。幸运的是，游戏中主要资源的状况和阶段是不可分割的。比如说，如果英雄还在推着外塔瞄准暴君（小龙），那嚒游戏肯定是刚开始。如果打中敌人的房子，那当然是后期啦。

因此，教AI判断形势，也要看塔、暴君、统治者（大龙）、水晶（base）等对敌人主要资源的打击情况。

上图显示了时期层关注的敌方主要资源，模型应从中学习，根据资源状况判断当前应打击哪些主要资源，进而判断应达到哪些小目标。

例如，盗取下图所示的蓝精灵（野怪），清除路兵线，就是要按这个时期的小目标。

分析形势，确定目标，知道该往哪里走，剩下的就是队友之间的沟通合作问题。

但要学会沟通，就不能训练人类对战的数据。毕竟，人类队友的沟通充满了怨念

因此，他设计了一种新的跨智能交流机制，让学员学会使用队友的注意标签来训练AI，预测队友要去哪里，并据此做出决定。

这样，一个团队中有五个代理可以合作，也可以说是“沟通”的机制。腾讯被称为模拟变压器智能通信（Imitated Crossagents Communication）

这篇论文的名字是：

Hierarchical Macro Strategy Model for MOBA Game AI

地址：

https：//arxiv.org/abs/1812.07887v1

作者：Bin Wu、Qiang Fu、Jing Liang、Peng Qu、Xiaoqian Li、Liang Wang、Wei Liu、Wei Yang、Yongsheng Liu，腾讯来自AI实验室。

对第一作者Bin Wu查了一下量子比特，他现在是腾讯AI实验室的高级研究员，也是王者荣耀AI算法设计和开发的技术负责人。

到目前为止，他还是腾讯量化交易项目的核心成员，负责设计和开发机器学习算法。该团队打造的模式，已经获得70%的净利润，2017年在A股市场的回报率为5%。

根据公开的资料，Bin Wu于2016年12月加入腾讯至今。此前，他在百度工作一年，负责Duer相关项目。

2011年，Bin Wu本科毕业于上海交通大学，2015年在香港科技大学获得博士学位。

好了，王者荣耀AI的话到此为止。

今天下午3点，KPL秋季比赛的决赛开始了。

Hero久竞vs BA黑菠萝

祝你好运，蘸酱~

至少节约2万元，国产特斯拉拥抱补贴降价，恭喜友商老板们都猜到了-量子位

特斯拉在柏林生产电池，但所需人才不足-量子比特

腾讯王者荣耀AI论文首次暴露：五AI王者局开黑与人类战队战平—量子位

猜你喜欢

突破传统领域，苹果前汽车业务领导引领家用机器人革新

网站的优化是什么_网站的优化是什么意思

AI芯片路线图全景展示：技术演进全景解析

AI大模型市场重磅动态：苹果智能的商业模式转型探索与期待

王坚谈人工智能浪潮下的企业创新：新大公司崭露头角

资本市场追逐AI潮流，智能机器人成为新兴产业标杆

vivo新品助力音乐盛宴，成为演唱会不可或缺神器

iPhone 13将推紫色版引热议：消息称Pro版本独享、比前代紫色更浓（新热议iPhone 13紫色版独家亮相Pro系列，色彩浓度超越前代引关注）

突破传统领域，苹果前汽车业务领导引领家用机器人革新

网站的优化是什么_网站的优化是什么意思

AI芯片路线图全景展示：技术演进全景解析

AI大模型市场重磅动态：苹果智能的商业模式转型探索与期待

王坚谈人工智能浪潮下的企业创新：新大公司崭露头角

资本市场追逐AI潮流，智能机器人成为新兴产业标杆

突破传统领域，苹果前汽车业务领导引领家用机器人革新

网站的优化是什么_网站的优化是什么意思

AI芯片路线图全景展示：技术演进全景解析

AI大模型市场重磅动态：苹果智能的商业模式转型探索与期待

王坚谈人工智能浪潮下的企业创新：新大公司崭露头角

资本市场追逐AI潮流，智能机器人成为新兴产业标杆