围棋大师 DeepMind AI 来打游戏了，第一个被虐的是星际争霸 2 职业玩家

在血洗棋坛之后，AI 又将它的触手伸向了游戏领域。

北京时间的 1 月 25 日凌晨，来自 Alphabet 旗下的 DeepMind 组织了一场线上直播，公开展示他们旗下的《星际争霸2》AI 项目「AlphaStar」的新进展，这其实不是类似电竞比赛一样的简单直播，更像是一场特别的发布会。

官方表示，自去年年底 12 月以来，该人工智能程序与高水平人类职业选手先后举行了 11 场比赛，而最终的结果是：1 比 10，人类是 1，惨遭 AI 碾压。与围棋领域的 AlphaGo 类似，AlphaStar 训练首先是模仿学习，训练大量人类比赛对战视频，让 AI 通过观察，尽可能地进行模仿，从而理解游戏基本知识，产生不同的「模型」，内部会用名为「Alpha League」的方法进行筛选，让不同的模型进行循环比赛，就诸多竞技游戏中的「天梯」一样。

近年来，《星际争霸2》被认为是最具挑战性的即时战略（RTS）游戏之一，也是有史以来游玩历史最悠久的电子竞技之一，已成为人工智能研究的重大挑战。相比起围棋，《星际争霸2》这种 RTS 游戏会对 AI 提出更高的要求，在围棋的一局中，所有的棋子对于双方都是完整可见的，并且双方会进行十分平和的「回合制战斗」。

而对于《星际争霸》等大多数即时战略来说，受到战争迷雾的影响，属于「不完美信息博弈」，这就要求人工智能做出实时反映，探索地图，同时结合游戏中不同的元素进行规划、决策和行动。所以与规则上明确清晰，节奏较为缓慢的围棋，以《星际争霸》为代表的即时战略一直是 AI 研究领域十分感兴趣的课题。

不仅是《星际争霸》，早在 2017 年的 DOTA 2 TI7 上，除了常规的比赛之外，Valve 安排了一场特殊的「人机对战」：一个名为 OpenAI 的人工智能，1V1 对战职业选手 Daniil Ishutin，最终的结果是，人类选手被 AI 碾压，AI 取得了最终的胜利。根据官方的视频，他们在私底下也曾经邀请过一些职业选手与 OpenAI 过招，可以从他们的反映看出来，这些一开始对 AI 表示轻视的「地表最强选手」，最后也被打了个一塌糊涂。

根据 OpenAI 官方的描述，与游戏中本身的 Bot 不同，他们从来没有为其编写程序，来让它理解 Dota 的规则，取而代之的是，AI 会跟自己对战，在自我教学中获得能力上的提升，而这一切，仅仅花了它两周的时间而已。开发者也确认，他们没有调用任何的 Dota 的 API 来获取诸如对手的位置、离自己的距离等等信息。

事后，OpenAI 的创始人之一 Elon Musk 也发推祝贺，称：「OpenAI 在电子竞技领域打败了世界上最好的选手，这要比传统的棋类游戏要有难度的多。」

DeepMind AI 和游戏里的 NPC 究竟有什么不同？

只要你玩过任意类型的游戏，就一定会碰到过叫这种做 NPC（Non-Player Character）的游戏角色，玩家一般会把控制 NPC 行动/交互/动作等等一系列动作背后的因素统称为 AI（人工智能）。然而互联网上诸多的 NPC 犯蠢集锦告诉我们：用于娱乐性质的电子游戏中的 AI 既不 Smart，也不 Intelligence。

事实上，电子游戏中的 AI 系统，本质上其实是一系列的 if this,then that 的条件语句，最简单的比如《合金装备》系列中，如果看到主角，敌人头上冒出的感叹号「！」并进行攻击。实际的情况可能要比这个复杂的多，会出现 if this and this but not this……这种十分精确的条件，这时候电脑自然要对符合条件的指令进行运算，来让这些 NPC 看起来拥有与人类一样的「智慧」，但它并不会进行任何自我学习。

尽管能够进行自我学习的机器学习在科技领域风头正热，但大多数的游戏作品还是采用了「行为树」（Behaviour Trees）这种技术来进行 AI 交互部分的设计。

简单来说，行为树系统是一种数据结构，开发者可以自行设置触发动作的条件以及执行的顺序，程序本身并不用思考什么，只负责运行就可以，由于结果看起来像是一种合理的行为，在设定的条件足够细致且多的情况下，玩家就会觉得「这个行为十分真实」，好吧，以目前的水平，只能说起码不笨。

Mark Brown 所制作的 Game Maker's Toolkit 中曾经提到，好 AI 让玩家作弊，让玩家知道他在想什么，是可预测的，可与系统交互，对玩家做出反应，有他自己的目标，不仅是敌人还能是朋友。游戏作为一种娱乐产品，NPC 的设计目的自然是让玩家玩起来觉得有趣，在一定时间的理解游戏规则之后，能够服务于整个设计本身，也就是通俗「有趣」。

而「AlphaStar」或者「AlphaGo」在与人类对战的过程中，会以出其不意的种种操作为行业带来打法、战术上启发性，不管是对于围棋是《星际争霸》，这也是它与游戏 AI 根本的不同。设计之初的目的性不同，造成了根本上的差异，一个是「通过交互手段娱乐人类」，而另外一个则是「通过与人类的对战，提升现今的 AI 技术水平」。

游戏 AI 的未来在哪？

或许在不久之后，经过自我学习和训练的 AI 将能够在基本所有的竞技性对战游戏里战胜人类，但那并不是游戏 AI 的最终目的。

是的，AI 在游戏上的运用仍待完善，但是已经有国外的工程师利用卷积神经网络在《GTA V》里训练 AI 开车，整个「学习」的过程都被放在了 Twitch 上直播，看起来一次又一次翻车还真有点蠢萌。而早在 2017 年，英特尔、达姆施塔特工业大学等也已经用《GTA V》开始测试自动驾驶的相关算法。（请问你要坐在《GTA V》中经过算法测试自动驾驶汽车吗🙂）

另外，EA 旗下的旗下技术研发部门 SEED 也创造了一个能让 AI 自学怎样玩《战地1》项目，尽管经过了大约 300 天的游玩训练，它们仍然无法制定或执行任何战术策略，有时还会围着一个圆绕圈，EA 表示，最终的目的是为玩家提供更强大、更真实的敌人，并帮助游戏开发人员调对游戏进行调试。

重要的是，如何利用 AI 来给玩家提供更好的游戏体验、伴随着 AI 与游戏的进一步融合，我们或许有一天真的会看到完全由自主 AI「自导自演」的游戏剧情，不知道这会让人毛骨悚然，还是震撼无比。

> 下载少数派客户端、关注少数派公众号，让你的生活更精彩 🎉

> 特惠、好用的硬件产品，尽在少数派sspai官方店铺 🛒