作者:Jonathan Lai,a16z合伙人;翻译:金色财经xiaozou
关于游戏领域的生成式AI革命的早期讨论主要集中在AI工具如何使游戏创建者更加高效——使游戏创建能够比以前更快、规模更大。尽管如此,我们认为从长远来看最大的机会不仅仅在于利用AI来改变我们创建游戏的方式,还在于改变游戏自身的性质。
我们很高兴看到生成式AI有机会促进新的AI-first游戏类别的创建,并极大地扩展现有游戏类型。从Rogue的程序生成地下城(1980年)到Half-Life的有限状态机(1998年),再到Left 4 Dead的AI游戏导演系统(2008年),AI一直在推动新形式的游戏玩法。关于深度学习方面的最新进展使计算机能够根据用户提示和大数据集生成新内容,这进一步改变了游戏规则。
前期,我们已经看到了一些有趣的AI游戏玩法领域,包括生成式智能体、个性化定制、AI叙事、动态世界和AI助手。如果成功的话,这些系统可以结合在一起,创建出新的AI-first游戏类别,这类游戏将能够长期娱乐、吸引并留住玩家。
1、Generative Agent(生成式智能体)
1989年,Maxis的SimCity开创了模拟题材游戏的先河,在这款游戏中,玩家可以建造并管理一座虚拟城市。如今,最受欢迎的模拟游戏是The Sims,在这款游戏中,全球超7000万玩家管理着“sims”虚拟人物,这些人物在这个虚拟世界里上演着日常生活。游戏设计师Will Wright曾将The Sims游戏比作“互动娃娃屋”。
生成式AI可以极大地推动模拟游戏的发展,通过LLM大语言模型使智能体具有突发的社会行为,从而更加逼真。
今年早些时候,来自斯坦福大学和谷歌的一组研究人员发表了一篇关于如何将LLM应用于游戏智能体的文章。在博士生Joon Sung Park的带领下,研究团队用25个类似Sims的智能体填充了一个像素艺术沙盒世界,这些智能体的行为由ChatGPT和“扩展LLM的架构来存储智能体使用自然语言的完整记录,将这些记忆合成为更高层的反射,并动态检索以规划行为。”
这有可能让模拟游戏迎来更精彩的未来。一开始,只有一个用户指定的建议,一个智能体想要举办一个情人节派对,各智能体们独立地分发派对邀请,建立新的友谊,互邀在两天后准时出现在派对上。
使这种行为成为可能是因为LLM是使用社交网络数据训练的,因此在LLM模型中有人类如何在各种社交环境下交谈和行为的构建块。在像模拟游戏这样的交互式数字环境中,这些反应可以被触发,创造出令人难以置信的逼真的突发行为。
从玩家的角度来看,最终结果是:更加沉浸式的游戏玩法。玩The Sims或殖民地建造经营模拟游戏RimWorld的大部分乐趣便来自于意想不到的情景,以及情绪的起起伏伏。通过社交网络语料库支持的智能体行为,我们可能会看到模拟游戏不仅反映了游戏设计师的想象力,还反映了人类社会的不可预测性。观看这些模拟游戏就像观看新一代的《楚门的世界》,带给玩家无尽的乐趣,这是今天预先编写好的电视或电影无法办到的。
利用我们对充满想象力的“娃娃屋”的渴望,智能体本身也可以个性化。玩家可以根据自己或虚构的角色塑造一个理想的智能体。Ready Player Me允许用户通过自拍生成自己的3D头像,并将他们的头像导入超9000款游戏/应用程序。AI角色平台Character.ai、InWorld和Convai允许创建具有自己的背景故事、个性化和行为控制的自定义NPC。想要创建一个Hogwarts模拟游戏,在那里你是哈利波特的室友?现在可以了。
凭借智能体高超的自然语言能力,我们与智能体互动的方式也得以扩展。如今,开发人员可以使用Eleven Labs的text-to-speech(文本到语音)模型为他们的智能体生成逼真的声音。Convai最近与NVIDIA合作进行了viral demo,其中玩家可以与AI拉面厨师NPC进行自然的语音对话,对话和匹配的面部表情会实时生成。人工智能陪伴应用Replika已经允许用户通过语音、视频和AR/VR与AI伙伴交谈。未来,我们可以设想这样一款模拟游戏:玩家可以在旅途中随时随地通过打电话或视频聊天与他们的智能体保持联系,回到电脑前再点击进入更加沉浸式的游戏玩法。
要知道,在我们看到一个完整的Sims版本之前,还有很多难题需要解决。LLM在他们的训练数据中存在固有偏差,这可以从智能体的行为中看出。在云端7*24小时实时运行规模化模拟游戏的成本可能在财务上并不可行——在2天内运行25个智能体会花费研究团队数千美元的计算费用。有望将模型工作负载转移到设备上,但相关工作仍然相对较早。我们可能还需要发现与智能体之间的准社会关系的新规范。
但有一件事是明确的——如今对生成式智能体的需求巨大。在我们最近的调查中,有61%的游戏公司计划尝试AI NPC。我们认为,随着智能体进入我们的日常社交领域,AI陪伴将很快变得司空见惯。模拟游戏提供了一个数字沙盒,我们可以以有趣的不可预测的方式与我们最喜欢的AI伙伴互动。从长远来看,模拟游戏的性质可能会发生变化,将反映出这些智能体不仅仅是玩具娃娃,还是潜在的朋友、家人、同事、顾问,甚至是恋人。
2、个性化定制
个性化游戏的最终目标是为每个玩家提供独特的游戏体验。例如,让我们先来看角色创建,无论是最初的Dungeons & Dragons桌游还是Mihoyo的Genshin Impact,角色创建几乎是所有角色扮演游戏(RPG)的支柱。大多数RPG都允许玩家通过预设选项自定义外貌、性别、职业等。但如果你能超越预设,为每个玩家和通关生成一个独特的角色怎么样?将LLM与text-to-image(文本到图像)的扩散模型(如Stable Diffusion或Midjourney)相结合的个性化角色构建者可以实现这一点。
Spellbrush的Arrowmancer是一款RPG游戏,由该公司基于GAN的定制化动画模型提供支持。Arrowmancer的玩家可以生成一整套独特的动画角色,具体到艺术风格和战斗能力。这种个性化定制也是其盈利系统的一部分——玩家将他们的AI角色导入自定义的gacha banner中,借此复制角色来加强他们的团队。
个性化定制也可以扩展到游戏道具中。例如,AI可以帮助生成只有完成特定任务的玩家才能使用的独特武器和护甲。Azra Games已经建立了一个AI驱动的资产pipeline,可以快速构思和生成巨大的游戏内物品和世界对象库,为更多样化的玩法铺平道路。AAA级游戏开发商Activision Blizzard创建了Blizzard Diffusion,这是图像生成器Stable Diffusion的翻版,可以帮助生成各种各样的角色和服装概念艺术。
游戏中的文本和对话也适合个性化定制。游戏世界中的各种标志可以反映玩家的头衔或地位。NPC可以被设置为具有不同个性的LLM智能体以适应你的行为——例如,对话可以根据玩家与智能体之间发生过的行为而改变。我们已经在一款AAA级游戏中看到了这一理念的成功执行——Monolith的Shadow of Mordor便拥有一个复仇系统,能够基于玩家的行动动态地创造出有趣的反派背景故事。这些个性化元素使得每个玩法都是独一无二的。
游戏发行商Ubisoft最近发布了一款基于LLM的对话工具Ghostwriter。发行商的作者现在使用该工具来生成背景对话和bark(在触发事件期间的对话片段)初稿,这有助于模拟玩家身边的现实世界。通过微调,像Ghostwriter这样的工具可能会被用于定制个性化的bark。
从玩家的角度来看,关于这些个性化定制的影响是双重的:增加了游戏的沉浸感和重玩价值。Skyrim和Grand Theft Auto 5等沉浸式开放世界游戏的角色扮演模式经久不衰,这表明了对个性化故事的潜在需求。即使在今天,GTA在角色扮演服务器上的玩家数量也一直高于原版游戏。我们认为个性化系统将成为所有游戏长期吸引和留住玩家的重要工具。
3、AI叙事
当然,优秀的游戏不只是角色和对话。还有一个令人兴奋的机会是利用生成式AI来讲述更好、更个性化的故事。
游戏个性化叙事的鼻祖是Dungeons & Dragons,在该游戏中,一个被称为地下城主的人会准备一个故事向一群人讲述,这些人在故事中扮演着不同的角色。这样的故事一部分是即兴的,一部分是RPG,这意味着每个通关都是独一无二的。作为个性化故事需求的信号,D&D如今极度受欢迎,其数字和模拟产品的销量均创下了历史纪录。
如今,许多公司将LLM应用于D&D的故事模型,机会就在于让玩家在极其耐心的AI叙事生成器的引导下,在他们喜欢的玩家创建或IP世界中花费尽可能多的时间。Latitude的AI Dungeon于2019年发布,是一款开放式的文字类冒险游戏,AI在游戏中扮演地下城主。用户还对OpenAI的GPT-4版本进行了微调,享受效果不错的D&D体验。Character.AI的文字类冒险游戏是该应用最受欢迎的模式之一。
Hidden Door更进一步,在一组特定的原始材料上训练它的机器学习模型——例如The Wizard of Oz——允许玩家在已建立的IP世界中大冒险。通过这种方式,Hidden Door与IP所有者合作,实现了一种全新的、互动式的品牌延伸形式。一旦粉丝们看完一部电影或一本书,他们就可以继续在自己喜欢的世界里进行自定义的D&D式的冒险。对粉丝体验的需求正在蓬勃发展——两个最大的在线同人小说库Archiveofourown.org和Wattpad仅在5月份就分别有超过3.54亿和1.46亿的网站访问量。
NovelAI已经开发了自己的LLM Clio,利用其在沙盒模式下讲故事,并帮助解决人类作家会面临的写作障碍。对于目光敏锐的作家来说,NovelAI让用户可以根据他们自己的作品对Clio进行微调,甚至是像H.P. Lovecraft或Jules Verne这样的著名作家。
值得注意的是,AI叙事还面临着许多障碍。开放式AI很容易偏离轨道,这让一切变得有趣,但对游戏设计来说却很麻烦。如今,创建一个优秀的AI叙事生成器需要大量的人类规则设置来创建好故事的叙事弧线。记忆和连贯性很重要——叙事生成器需要记住一个故事之前发生的事情,并且保持事实和风格的连贯性。对于很多闭源LLM来说,解释能力仍然是一个挑战,因为它们就像黑盒一样运行,而游戏设计师则需要理解为什么系统会以这种方式运行以改善游戏体验。
然而,随着这些障碍正在被攻克,AI现如今已经成为人类故事讲述者的助手了。现在,成千上百万作家都在使用ChatGPT为自己的故事提供灵感。娱乐工作室Scriptic利用DALL-E、ChatGPT、Midjourney、Eleven Labs和Runway,和人类编辑团队一起来构建交互式的、可自主选择的冒险节目,在Netflix上就可观看。
4、动态世界构建
虽然基于文本的故事很受欢迎,但许多玩家也渴望看到他们的故事在视觉上能够栩栩如生。生成式AI在游戏领域的最大机会之一可能就是帮助创造玩家将在其中度过无数时间生活的世界。
虽然在今天还不可行,但一个常被提及的愿景就是随着玩家在游戏中的进展情况实时生成关卡和内容。这类游戏的一个典型例子就是Mind Game。Mind Game是一款AI指导的游戏,可以实时适应每个学生的兴趣,游戏世界基于学生的行为和AI可以推断的任何其他心理信息而发展变化。
今天,最接Mind Game的游戏可能就是Valve的 Left 4 Dead了——该游戏利用AI Director导演系统来控制游戏的动态节奏和难度。AI Director没有为敌人(僵尸)设置出生点,而是根据每个玩家的状态、技能和位置将僵尸放置在不同的位置,设置为不同的数量,从而在每个通关中创造独特的体验。该导演系统还通过动态视觉效果和音乐来营造游戏氛围。Valve创始人Gabe Newell将这一系统称为“procedural narrative”(程序叙事)。EA广受好评的Dead Space Remake使用了该AI导演系统的变体来最大化恐怖感。
虽然这在今天看来似乎属于科幻小说领域,但有可能有一天,通过改进的生成式模型以及获取足够的计算和数据,我们可以构建这样一个AI Director:不仅能够生成超级恐怖的感觉,还能生成世界本身。
值得注意的是,游戏领域里机器生成关卡的概念并不新鲜。从Supergiant的Hades到Blizzard的Diablo,再到Mojang的Minecraft,如今许多最受欢迎的游戏都使用了程序生成技术——一种随机生成关卡的技术,使用由人类设计师运行的方程式和规则集,每次的通关都有所不同。一个完整的软件库已经建立用于协助程序生成。Unity的SpeedTree可以帮助开发者生成虚拟树叶,就像你在电影阿凡达中的潘多拉森林或Elden Ring的风景中看到的那样。
游戏可以将程序资产生成器与用户界面中的LLM结合起来。游戏Townscaper使用程序化系统,只需要两项玩家输入值(块位置和颜色),就可以变成绚丽的城镇景观。想象一下,Townscaper在用户界面中添加一个LLM,帮助玩家通过自然语言提示迭代出更加微妙和美丽的创作。
许多开发人员也对利用机器学习增强程序生成的潜力感到兴奋。有一天,设计师可能会使用在风格相似的现有关卡上训练的模型,迭代生成一个可行的关卡初稿。今年早些时候,Shyam Sudhakaran带领哥本哈根大学的一个团队创建了MarioGPT——一个GPT2工具,可以使用在超级马里奥1和2的原始关卡上训练的模型来生成超级马里奥关卡。关于该领域的学术研究已有一段时间了,包括2018年使用生成式对抗网络(GAN)设计第一人称射击游戏DOOM关卡的项目。
生成式模型与程序系统协同工作,可以显著加快资产创建速度。艺术家已经在使用文本到图像的扩散模型来制作AI辅助的概念艺术和故事板。
关于3D生成也有大量研究。Luma使用神经辐射场(NeRFs)允许消费者通过iPhone上捕获的2D图像构建出逼真的3D资产。Kaedim在loop质量控制中使用AI和人类一起创建生产就绪的3D网格,如今已被至少225个游戏开发者使用。CSM最近发布了一个专有模型,可以从视频和图像中生成3D模型。
从长远来看,最重要的是使用AI模型进行实时世界构建。我们认为未来整个游戏将不再需要渲染,而是使用神经网络在运行时生成。NVIDIA的DLSS技术已经可以使用消费级GPU实时生成新的更高分辨率的游戏帧。有一天,你也许可以点击Netflix电影的“互动”按钮,就能进入一个每个场景都在实时生成的世界,并为玩家提供独特的个性化服务。在未来,游戏将变得与电影无异。
值得注意的是,动态生成的世界本身并不足以创建出一款优秀的游戏,这一点从人们对No Man’s Sky的批评中就可看出,该游戏发布时便拥有了超过18万亿的程序生成行星。动态世界的前景在于它可与其他游戏系统(如个性化定制、生成式智能体)相结合,开启叙事新形式。毕竟,Mind Game最吸引人的部分就是它如何为终端玩家塑造玩家自己的世界,而非游戏世界本身。
5、AI Copilot:所有游戏的AI助手
我们之前讨论了在模拟游戏中使用生成式智能体,这里还有另一个新用例,即AI充当游戏助手来指导我们玩游戏,在某些情况下甚至能与我们一起玩。
AI copilot对于引导玩家进入复杂游戏来说是非常重要的。例如,Minecraft、Roblox或Rec Room等UGC沙盒都是非常丰富的环境,如果玩家有合适的材料和技能,他们几乎可以在其中建造任何他们想象的东西。但存在一个难度很高的学习过程,大多数玩家都不太容易能弄清楚该如何起步。
AI copilot可以让任何玩家成为UGC游戏中的Master Builder——根据文本提示或图像提供逐步指导,并指导玩家克服错误。LEGO世界里的“Master Builder”概念就是一个恰当的参照对象——少数人有能力在需要的时候看到他们所能想象的任何创造的蓝图。
微软已经在为Minecraft开发AI copilot,使用DALL-E和Github Copilot,使玩家能够通过自然语言提示将资产和逻辑插入Minecraft。Roblox正在积极地将生成式AI工具整合到Roblox平台中,其使命是让“每个用户都成为创造者”。无论是使用Github Copilot进行编码还是使用ChatGPT进行写作,AI copilot在共创方面的高效性已经在很多领域里得到了证明。
除了共创,受过人类游戏玩法数据训练的LLM应该能够理解如何在各种游戏中如何行为。通过适当的整合,智能体可以在玩家的伙伴不在时充当合作伙伴,或者在像FIFA或NBA 2k这样的正面交锋的游戏中充当对手方。这样的智能体总是可以随叫随到,不管结果是胜利还是失败,总是那么和蔼可亲,从不评头论足。根据我们的个人游戏历史进行微调,智能体可以大大优于现有的机器人,完全按照我们自己的方式或者以互补的方式玩游戏。
已有类似的项目在约束环境测试下成功运行。热门赛车游戏Forza开发了一个Drivatar系统,该系统利用机器学习为每个人类玩家创建一个AI驾驶员,模仿他们的驾驶行为。这些Drivatar被上传到云端,当他们的人类伙伴离线时,他们可以被召唤出来与其他玩家比赛,甚至可以获胜赚积分。谷歌DeepMind的AlphaStar在Starcraft II “长达200年”的游戏数据集上进行训练,创造出可以在游戏中与人类职业电竞选手比赛并获胜的智能体。
AI copilot作为一种游戏机制甚至可以创建全新的游戏玩法模式。设想一下这样的Fortnite,每个玩家都有一个Master Builder魔杖,可以通过提示立即建造狙击塔或燃烧的巨石。在这种游戏模式中,胜利可能更多取决于魔杖的操作(提示),而非瞄准能力。
完美的游戏内AI“伙伴”的梦想已经成为许多热门游戏中令人难忘的一部分——只要看看Halo世界里的Cortana,The Last of Us中的Elle,或者Bioshock Infinite中的Elizabeth就知道了。而对于竞技游戏来说,打败电脑机器人永远不会过时——从Space Invaders中的摧毁外星人,到Starcraft中的comp stomp,最终发展为自己的游戏模式Co-op Commanders(合作指挥官)。
随着游戏演变成下一代社交网络,我们预计AI copilot将扮演越来越重要的社交角色,如教练及/或合作伙伴。众所周知,添加社交功能可以提高游戏的粘性——有好友的玩家留存率可以提高5倍。我们预期未来每款游戏都会有一个AI copilot,将遵循这样一句箴言:“一个人玩很好,与AI一起玩更好,与朋友一起玩最好。”
6、结论
我们还处于将生成式AI应用于游戏的早期阶段,在将这些想法投入生产之前,还需要解决许多法律、道德和技术方面的障碍。除非开发者能够证明其拥有所有用于训练模型的数据的所有权,否则带有AI生成资产的游戏的法律所有权和版权保护在今天基本上是不明确的。这使得现有IP的所有者很难在他们的生产中使用第三方AI模型。
对于该如何补偿训练数据背后的原作者、艺术家和创作者,也存在很大的担忧。难点在于,目前大多数AI模型都是使用互联网上的公共数据进行训练的,其中大部分数据是受版权保护的。在某些情况下,用户甚至可以使用生成式模型再现某位艺术家的确切风格。现在还为时尚早,对内容创作者的补偿需要适当地确定。
最后,现在的大多数生成式模型成本太高,无法在云端全球规模7*24小时运行,而这是当今的游戏运营所必需的。为了实现经济高效的扩展,应用程序开发人员可能需要找到方法将模型工作负载转移至终端用户设备,但这还需要时间。
然而,目前可以确定的是,有大量的开发者活动和玩家对游戏领域的生成式AI大有兴趣。虽然少不了很多炒作,但我们很高兴看到该领域确实有很多才华横溢的团队,他们废寝忘食地致力于开发创新的产品和体验。
我们的机会不仅在于让现有游戏变得更快、更便宜,还在于解锁以前不可能出现的AI-first游戏新类别。我们不知道这些游戏最终会是什么样儿,但我们知道游戏产业的历史一直都是技术推动新形玩法的历史。回报可能是巨大的——有了生成式智能体、个性化定制、AI叙事、动态世界构建和AI copilot这样的系统,用不了多久我们可能就会看到由AI-first开发者创建的第一款“永无止境”的游戏。
来源:金色财经