Facebook 开源史上最大星际争霸 AI 研究数据集

达尔文
 达尔文
发布于 2017年08月08日
收藏 27

在 AlphaGo 征服围棋之后,即时战略游戏《星际争霸》已经成为各家科技巨头与大学的下一个目标。Facebook 在这一方面的研究似乎正处于领先地位。7 月初,田渊栋等人开源了基于星际争霸的人工智能游戏平台(参见:Facebook 开源游戏平台 ELF,简化版《星际争霸》完美测试人工智能)。最近,Facebook 又发布了一个大体量星际争霸录像数据集 STARDATA,旨在为广大研究者提供方便。

即时战略游戏(RTS)因为复杂的游戏环境、战争迷雾的限制、以及大量专业玩家带来的 Replay 录像,正成为人工智能研究的热点方向。这些游戏因为其复杂性与拟真性,在训练强化学习等算法的任务中的结果要远远好于棋盘类游戏。另一方面,由于近期基于大数据集的深度学习方法兴起,人们开始意识到,此类方法的性能提升需要依赖于大量数据的训练。

虽然星际争霸可以通过直接开打的方式来训练人工智能,但由于游戏中的动态变化种类繁多,这种方法的效率很低,最有效的方式是利用人类玩家生成的游戏 Replay。星际争霸的 Replay 是一种基于玩家指令的游戏录像文件——通过存储指令而非画面的方式,游戏录像的文件尺寸被压缩到了很小的尺寸,另一方面,这也为人工智能的训练带来了方便——游戏的信息可以在 Replay 文件中直接提取出来。

但仍有几个方面的问题让机器学习难以利用这些游戏录像。首先,星际争霸 Replay 的重建速度有限,这意味着训练速度会受到限制;由于星际争霸游戏的版本更迭,不同版本游戏的 Replay 与游戏无法互相兼容,这限制了可用数据的数量;最后,游戏录像的重建只能在 Windows 系统中才能保持稳定。基于以上问题,Facebook 的研究人员认为提取游戏录像中的有效信息并将其以数据集的形式存储是最好的方式。

一个易于训练模型的数据集必须满足以下要求:

  • 普适性:存储在数据集中的数据可用于学习不同层面的游戏策略。所以,该数据集中包含的数据应该尽可能地包含最多的游戏情况。

  • 多样性:该数据集必须包含多种游戏场景、对战形式、地图和玩家策略等。

  • 有效性:该数据集需要能够代表星际争霸玩家的正常水平,对战两方都不能消极比赛。

  • 易接入性:用户应该可以轻松使用该数据集代替游戏引擎来使用游戏中的状态数据。

  • 可操作性:数据集应该兼容各种平台与系统。

考虑到以上要求,Facebook 的研究人员构建了用于星际争霸人工智能研究的新一代数据集 STARDATA。它相比于此前类似的数据集体量大上十倍,其中包含了大量不同的对战形式、统计数据、地图等等。

表 1: 星际争霸 AI 数据集收集比赛的来源。GG=GosuGamers.net,TL=TeamLiquid.net,IC=ICCup.com,YG=ygosu.com,BR=bwreplays.com 。

表 2: 数据集中不同类型比赛的游戏数量。P = 神族,T = 人族,Z = 虫族。

表 3: STARDATA 中最常见的地图。

图 2: 游戏时间长度的密度图,以分钟为单位。持续时间超过 60 分钟的几个异常值未显示。

于时间超过 60 分钟,单元超过 1000 个的游戏长尾不予显示。我们从这些密度图中观察到几个有趣现象:(1)大多数 ZvZ 比赛倾向于很快结束。(2)TvT 和 PvT 游戏通常会持续很久。(3)有虫族参与的游戏倾向于以极少或者大量单位结束。我们观察到一个趋向于 0 的非常斜交的分布,但是也带有一个胖尾(fat tail)。(4)神族玩家制造了最少数量的单位,尤其是在游戏后期中。

论文:STARDATA: A StarCraft AI Research Dataset

论文摘要:我们发布了一个包含 65646 个星际争霸 replay 的数据集,其中有 15.35 亿帧和 4.96 亿玩家动作。我们提供完整的游戏状态数据以及可在星际争霸中观看的原始 replay。游戏状态数据每三帧记录一次,以确保对更广泛的机器学习任务的适宜性,比如策略分类、反转强化学习、模仿学习、前向建模、部分信息提取等。我们使用 TorchCraft 提取和存储数据,这为 replay 和游戏的直接读取标准化了数据格式。此外,数据可被用在不同的操作系统和平台上。数据集仅包含有效、无损坏的 replay,其质量和多样性通过一些启发法来确保。我们通过不同的统计数据说明数据的多样性,并提供了已从数据集中受益的任务实例。

来源:机器之心

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Facebook 开源史上最大星际争霸 AI 研究数据集
加载中

精彩评论

产吅经理
产吅经理
以前这个东西叫外挂
梅开源
梅开源
以前很寂寞的时候就靠星际争霸打AI活下来。什么时候能出点陪玩AI真的很满足。

最新评论(22

东方星痕
东方星痕

引用来自“linux工人”的评论

反正多打少AI应该赢不了……
嗯, 正式比赛还会被来自东方的神秘力量干扰
苍暮之星

引用来自“苍暮之星”的评论

理论上,电脑AI可以窥屏。以前玩过War3的AI包,基本上你出什么兵,它接着出克制兵种,完全无视战争迷雾。

引用来自“Lunma”的评论

那是系统自带的AI,上面说的AI是模拟人来操作的
但如果分析的是数据而非影像图片的话,那本身貌似与AI去理解这个游戏还是没什么关系吧。我理解的真正AI是用摄像头观察屏幕,而后分析战局并给出对应的操作指令。直接去分析操作质量貌似说到底还是在那推算步数吧,说到底还是国际象棋那种算法,穷举。比如说游戏记录某玩家鼠标点击小地图某区域,但是AI又“看不见”,对他来说这一步是废操作,而对于人类玩家这个是快速切换地图显示区域的方式。真心看不出这所谓AI和自带的AI有多大的区别。
Lunma
Lunma

引用来自“苍暮之星”的评论

理论上,电脑AI可以窥屏。以前玩过War3的AI包,基本上你出什么兵,它接着出克制兵种,完全无视战争迷雾。

引用来自“Lunma”的评论

那是系统自带的AI,上面说的AI是模拟人来操作的

引用来自“东方星痕”的评论

这怎么输嘛,不可能的!
你很有黄旭东的潜质
梅开源
梅开源

引用来自“梅开源”的评论

以前很寂寞的时候就靠星际争霸打AI活下来。什么时候能出点陪玩AI真的很满足。

引用来自“土卫十六”的评论

是啊,大学里很寂寞的,是它陪伴了我很久。不过大学毕业以后,更喜欢英雄无敌3,至今有时候还玩一把。
一样啊。4也好玩,音乐也经典。 我特别喜欢看同盟的雄起到处烧杀抢掠。有时候忽然送点资源来好温暖。
姓名长度最少3
姓名长度最少3
高级自动挂
东方星痕
东方星痕

引用来自“苍暮之星”的评论

理论上,电脑AI可以窥屏。以前玩过War3的AI包,基本上你出什么兵,它接着出克制兵种,完全无视战争迷雾。

引用来自“Lunma”的评论

那是系统自带的AI,上面说的AI是模拟人来操作的
这怎么输嘛,不可能的!
东方星痕
东方星痕
我去! zvz都用极限rush吗?
土卫十六
土卫十六

引用来自“梅开源”的评论

以前很寂寞的时候就靠星际争霸打AI活下来。什么时候能出点陪玩AI真的很满足。
是啊,大学里很寂寞的,是它陪伴了我很久。不过大学毕业以后,更喜欢英雄无敌3,至今有时候还玩一把。
waylau
waylau
星际争霸 啊 经典游戏,勾起我童年回忆~
中国牛逼开源程序员
GG rang wo jin jue sai ba
返回顶部
顶部