TStarBots是《星际争霸2》游戏AI的代码实现。TStarBots使用了深度强化学习、模块化AI和动作空间分解等算法,以及大规模分布式强化学习平台。详细技术描述请参考Tencent AI Lab发布的预印本[1]. 我们期望其他研究人员或开发者能够在TStarBots的基础上继续研究或二次开发,与我们共同推进《星际争霸2》游戏AI研发的前沿、探索通用人工智能新的边界。

本次开源的代码包括三部分:

  • PySC2TencentExtension: 这是Deepmind原版PySC2的一个扩展。增补的内容包括:1)暴露了game core中的raw interface 2) 添加了TechTree Data. 这部分的内容描述请参考[1]的3.1节
  • TStarBot1: 这是一个基于动作空间扁平化建模和深度强化学习的AI. 详细描述见[1]的3.2节。
  • TStarBot2: 这是一个基于动作空间层级化建模和规则控制器的AI. 详细描述见[1]的3.3节。

参考文献

[1] https://arxiv.org/pdf/1809.07193.pdf

Github开源地址:

https://github.com/Tencent/TStarBots

(点击文末阅读原文直接访问)

请给 TStarBots 一个 Star !
 欢迎提出你的 issue 和 PR!

文章来源于腾讯云开发者社区,点击查看原文