开发一款产品将会更简单,但成就一个产品不会更容易。
去年 10 月的一个下午,游戏原画师刘渡(化名)正在修图,一位游戏策划来到他邻座,指着同事的屏幕说:“这是 AI 出的图,你修一下我们就用了。”
他看到屏幕上有三张游戏场景图,画风写实,和公司常用的风格不太搭,但细节足够丰富。隔壁同事用 Photoshop 给三幅图加滤镜变成卡通风格,不用一个下午就改完发给了策划。
刘渡意识到,他设想的职业成长路径走不通了。他刚毕业一年多,计划在这间主做出海市场的中等规模游戏公司好好磨炼手绘技巧,再跳去更大的平台。
“拼了命地去学手绘也很难走下去了。” 刘渡自己画一张类似的图,从构思到画,再到打磨细节,需要三天。
一个月后,ChatGPT 发布,很快引起全世界对 AI 替代人类创造性工作的担忧。单个作品制作周期普遍超过一年、需要公司内外上百人绘制至少几千张图的游戏行业对此格外上心。
从游戏外包公司负责人,到不同规模游戏公司的美术制作人员和团队负责人,我们采访的十几位从业者都在过去半年里对 AI 制作水平感到震撼。
震撼之后是焦虑。焦虑之后,其中一些人感受到的是,兴奋和满足。
半年后,刘渡已经不在游戏公司工作。他主动离职加入一家文旅创意公司,成了一个 “单人创意团队”,平均每天用 Midjourney 生成上百张图,选出其中几张,修改后用在公司的营销海报里。
刘渡主要靠自学。他最早从淘宝上花 30 多元买教程,后来跟着 B 站 UP 主的视频试验,尽可能跟上技术更新的进度。最近他建了一个 “AI 绘画交流分享” 群,和感兴趣的朋友一起关注最新进展。
新工作更轻松,但收入更高了。刘渡说是因为学了 AI 才拿到这份工作。现在他又重新找到了绘画的乐趣,不用 AI、不为工作,画自己想画的东西。
腾讯游戏、网易游戏已经在内部推广 AI 作图工具。大量游戏公司把人工智能生成的图片、文字放到游戏和宣传海报中。
上海一家游戏公司美术人士说,公司不鼓励员工用 AI 作图工具,因为 “米其林三星厨师做菜不放味精”。他还是看到许多同事悄悄用相关工具,让工作更快一点。
重人力的外包行业受冲击最大。成都一家游戏美术外包公司负责人已经在最近两个月丢掉多个客户,都是因为客户公司自己开始用 AI 作图。他已经跟几位相熟的老员工建议,早为将来做打算。
就像每一次生产力革命的到来,一些人失去工作、一些人会得到发展机会。最终,更擅长用新工具的人抢走工作。
半年时间,人工智能在游戏业从玩具变成了工具
去年 10 月,心动公司 CEO 黄一孟就在社交媒体上说 AI 作画很火,“是时候给自己找个理由,重新配一台 4090 (显卡)的电脑了”。
心动公司一边投资制作游戏、一边运营手机游戏分发平台,年收入 34 亿元。从大学时和同学戴云杰联合创办资源分享社区 VeryCD 算起,黄一孟已经创业 20 年。他一直热衷于亲自体验最新的科技产品和游戏。
不过新电脑送到家之后,黄一孟主要还是用来玩游戏,“当时完全没想到 AI 作画的影响力这么大”。
制作一款现代游戏工程浩大,主要步骤都需要美术团队参与:
- 概念和策划:根据游戏策划的前期讨论,制作概念图,让整个团队的美术、策划、开发成员直观感受游戏的氛围、目标受众等。
- 原画:画出游戏中的主要角色、场景,和模型、开发等各方确认是否可以在游戏中实现。
- 生产阶段:根据原画制作所有角色、场景不同视角的精细图片,然后交给模型团队做成 3D 模型,变成游戏里的角色和物体。游戏里的每个道具、技能图标也都要美术团队绘制——复杂的 RPG 游戏里会有上千个。
《塞尔达传说:旷野之息》场景概念图、角色原画、动作 3D 模型设计图。来源:任天堂
《塞尔达传说:旷野之息》实机场景。来源:任天堂
“这是一个人力密集型行业。” 一位曾在国际 3A 游戏公司负责图像的人士说。他当时所在的游戏制作核心团队大概 40 人,只有 3 人负责美术。但这 3 人背后有一个庞大的美术制作体系:团队所在地有 150 人的美术中台团队为他们服务;在上海有公司的内包美术团队,给这 150 人服务;在中国其他城市,比如南京、成都,还有团队为上海的内包团队工作。多位游戏行业人士估算,现在开发一款游戏的成本,50% 用在美术上。
半年多之前,AI 作图应用无法精确控制生成图片的风格或内容。AI 工具能做的只是在第一个阶段生成概念图。这是游戏制作过程里美术团队投入最少的一个工作。“其实去网上找图也不慢,只是让大家有个感觉。” 一位游戏美术中台负责人对《晚点 LatePost》说。
刘渡所在游戏公司能先用上 AI 工具作图,主要原因是他们当时没开发新游戏,美术工作主要画概念图和营销用的图。最耗费精力的生产环节还无法用 AI 加速。
许多游戏公司人士的想法跟黄一孟类似,那时并不认为 AI 会大幅提高生产力。在一次业内活动上,还有腾讯游戏团队的人说 “外包就是我们的人工智能”。
到 2022 年底,当全球关注 ChatGPT 的时候,AI 作图应用也有了重大突破。一位韩国科学技术院的开发者把 LoRA 用到了 Stable Diffusion 中。开发者只需要上传几十张相同风格的图片进 Stable Diffusion,就能训练一个专门生成同种风格图片的模型。
LoRA 最早由微软发明,用于低成本微调大语言模型,它让 AI 作图变得可控且便宜。基于 Stable Diffusion 训练一个 LoRA 作图模型,一台配备英伟达 4090 游戏显卡的电脑一晚上就能完成。
基于 LoRA 微调模型生成的图,左侧为手绘图,右侧为 AI 生成的图片。来源:游戏动画师大谷 Spitzer
两个月后,斯坦福大学的博士生 Lvmin Zhang 开发了 Stable Diffusion 插件 ControlNet,让人可以精确指挥 AI 模型生成图片细节。比如使用者可以要求 AI 将白猫变成黑猫,整个过程不会改变猫的样子;也可以要求 AI 按照手绘的线稿上色。
用 ControlNet 控制模型给手绘线稿上色。来源:ControlNet 的 GitHub 页面
从人指挥人,到人指挥 AI
在心动美术中台团队办公区,许多人工位上都有两个屏幕,一个显示游戏画面,另一个显示代码。经过几个月的摸索,心动逐渐尝试把 Stable Diffusion 嵌入到游戏生产过程里。
概念图以外,目前最成熟的工序是画图标。图标是游戏中表示道具、技能、功能等要素的图片,是最常见的美术资产。
“好的图标能提升游戏质感,它也是非常消耗资源的部分。” 心动美术中台负责人曾子锋说。如果要求制作精良,每个图标至少需要一位画师画一天。现在用人工智能辅助,心动制作图标的效率提升将近 4 倍。
美术不用再照着原型图一遍一遍上色,修改细节,耗费大量时间。画师可以先画十几张完整的图,用 LoRA 调整 Stable Diffusion,训练一个风格确定的模型。然后,他们只要画好草图,输入到模型中,用 ControlNet 控制生成细节,然后给模型生成的图提修改建议,让模型继续生成,最后再由自己定稿。
曾子锋 2000 年开始学习用计算机绘画,毕业后先做了用户体验设计,后来进入游戏行业,经历过多次技术革新对商业绘画和设计的冲击。
今年新年后,曾子锋给一款游戏的美术团队负责人介绍人工智能。他让对方先画个背包图标的草图、指定想要的风格,输进调整好的 Stable Diffusion 。不到一分钟时间,屏幕上出现了 50 个风格相同但不重样的背包图标,“如果不满意,再点一下就能再有 50 个”。他看到对方脸上无法抑制的激动表情。这位负责人在 5 分钟内就决定采用新技术,解决积压的工作。
图标的绘制之前大多由外包团队完成。曾子锋在确定人工智能工具可以提高效率后,就暂停了部分美术外包,“我们需要先了解研究 AI 技术会给美术流程带来多大的变化”。他打算先内部摸清楚 AI 对制作效率提升多少,再和外包团队商量新的生产节奏和成本。
一同停掉外包还有心动的游戏翻译团队,替代者是 ChatGPT。“原本内部也有人负责后续审核和润色。(外包)换成 AI,怎么着都提升效率。” 黄一孟说。ChatGPT 还能根据设定给游戏中的场景、角色、技能取名字、写描述,“策划肯定都用得上”。
技术实力更领先的育碧,则是开发了一个类似 ChatGPT 的文本生成工具 Ghostwriter(影子写手),辅助游戏开发者写游戏角色的次要对话。根据育碧的演示,开发者往 Ghostwriter 里输入背景信息,应用会生成几条文字,让开发者选择更合适的那一条——这个选择的过程就是人对 AI 作出反馈,可以提升模型的能力。
在高度分工的行业,通常是一些人指挥另一些人完成更初级的工作。AI 的介入基本不会完全替代一个工种,但初级工作需要的人力大大减少。
游戏的分发和推荐也需要 AI 大语言模型的介入。心动经营的 TapTap 是全球最大的手机游戏玩家社区,中国版每个月有超过 4000 万人使用。过去一年,靠着改进推荐算法等措施,TapTap 的收入增长超 40% 到近 10 亿元。
TapTap 算法团队负责人李昀泽是心动公司最早意识到 ChatGPT 潜力的人之一。他 2020 年离开阿里妈妈加入心动,带队重写了 TapTap 广告推荐算法。ChatGPT 发布不到一周,他就给公司的高管们做了一次技术分享,在那之后,他的大部分精力都在研究如何以 AI 提升 TapTap 的效率。
李昀泽现在最要紧任务,是带着团队汇总游戏相关的文本数据,用开源的大语言模型开发新的搜索功能,让用户在 TapTap 上更准确地找游戏、查攻略。
“游戏也是一个学习产品,一款游戏好不好玩,需要深度体验、掌握技巧后才能有明确感受”。李昀泽说,ChatGPT 类似的技术,可以降低用户学习一款游戏的门槛,让玩家受众变得更广,从而提升整个行业的效率。
昨天还绕不开的技术问题,今天可能就解决了
技术在快速迭代。此前半年,李昀泽和曾子锋有共同的感觉。
和黄一孟等公司高管确认要开发 TapTap 新功能后,李昀泽制定的方案是用开源的大语言模型,用心动积累的专有数据训练,“当时觉得调用 ChatGPT 的 API 太贵了”。
到了 3 月初,OpenAI 把 ChatGPT 的 API 价格压低到原来的十分之一,处理百万个单词还不到 20 元人民币。他制定的开源方案随之动摇,最大的价格问题已经解决,心动开始使用微软在中国代理的 ChatGPT 服务。
现在,心动的方案又回到了开源大模型上。从 Meta 开源 LLaMA 之后,开源社区每天都有大量的项目诞生,效果持续提升。虽然效果还有差距,开源社区已经具备了复刻一个 ChatGPT 的所有组件。
“最难的是学习过程,因为它进展得特别快。” 李昀泽说。他与几位大模型创业者建了个微信群讨论最新技术进展和论文,半天不看,未读消息就有 99+。
“CPU (脑子)已经很久没有全负荷运转了。” 曾子锋也说,“过去这几周,完全没停下来过,因为信息更新太快了”。
他现在与同事交流技术,都会事先强调 “今天说的话,不一定明天就会有用”。他有过切实体会。
今年 2 月,曾子锋刚把 “用人工智提升美术效率” 写进年度 OKR 没多久,就遇到瓶颈。LoRA 能控制模型生成图片的风格,但无法控制细节,很难用到实际美术生产环节。他和同事想尽各种办法——试验不同的提示词,调整训练 LoRA 的方式,尽可能让模型再听话一些,效果都不够好。
然后 ControlNet 出现了。“之前绞尽脑汁想达到的效果和画面控制力,通过它很简单的就实现了。” 他说。
为了让团队成员更快地跟上技术迭代速度,心动美术中台部门每周五都会组织 AI 技术交流会,鼓励同事分享使用 AI 的技巧和新技术信息,公司也建了专门讨论 AI 的 Slack 频道。
心动组织 AI 交流会的场景。来源:心动公司
在 AI 作图工具和 ChatGPT 提高游戏资产制作效率前,AI 已经可以模仿配音演员,帮游戏公司提高游戏角色配音的效率,并在建 3D 模型、动画制作、测试等环节发挥作用。
现在,AI 带来的冲击远未结束。心动的员工正研究怎么用 AI 生成游戏角色不同角度的图片,找出一个更低成本制作 3D 模型的方式。这是现在 AI 作图工具的短板——它可以理解文字、颜色,很难理解空间。
技术更强的公司已经加入进来。游戏引擎公司 Unity 放出的 AI 工具宣传片中,第一句话就是 “生成一个 3D 女性角色”。OpenAI 近期也发了一篇论文,研究 AI 怎么更好的生成 3D 资产。
今年 3 月举办的全球游戏开发者大会(GDC)上,AI 是最热门的话题——从游戏环境素材、配音、NPC 脚本写作等一切人工智能可以参与的环节都有人讨论。每一场有关 AI 的讨论都座无虚席,还有数百人冒着大风、暴雨去参加 a16z 等机构赞助的 AI 活动。
市场调研机构 Omdia 游戏技术首席分析师利亚姆·迪恩(Liam Deane)逛完全球游戏开发者大会后的感受是,行业普遍认为 AI 会对游戏行业产生重大影响,但还没有几家公司做出来 ChatGPT 或 Stable Diffusion 等新技术驱动的产品。根据 Omdia 的数据,截至今年 3 月,只有 5% 的游戏技术供应商做出了新工具。这意味着未来会有巨大的发展空间。
开发一款产品将会更简单,但成就一个产品不会更容易
AI 技术会简化制作美术的过程,节省时间和金钱,降低开发游戏的门槛。但制作一款成功的游戏不会更容易。甚至制作一款游戏需要的人可能也不会变少。
1980 年代,乔布斯买下 Pixar,他认为随着计算机做制作 3D 画面能力变强,制作电影特效的成本会大大降低。他对了,也错了。
今天电影特效的制作成本大为降低,一些曾经无法想象的画面已经能实现。但大制作电影用了更多更真实的计算机特效。迪士尼 2019 年的《复仇者联盟 4》光计算机特效费用就超过 3.5 亿美元,超过 2000 年之前任何一部电影的总开支。
游戏也是类似。30 年前,游戏公司开发一款游戏,开发者得从头写所有代码,处理软件与各种底层硬件的交互细节。
30 年后,Unity、Unreal 等游戏引擎普及,把游戏的底层开发工作简化。现在游戏开发商想实现高难度的技术,比如 3D 场景实时渲染,靠各种各样的编程接口就可以完成。2020 年发售的《赛博朋克 2077》制作成本高达 1.74 亿美元、营销又花了 1.4 亿美元。在游戏引擎普及前,500 万美元做一个游戏已经算超大手笔。
如 Midjourney 创始人大卫·霍尔兹(David Holz)的总结,新技术出现后,有些人会试图削减成本,有些人会试图扩大业务规模。“想扩大业务规模的人,仍然会花同样多的成本。而那些试图削减成本的人,我认为会失败。”
北京一家中型游戏公司负责新品孵化业务的人士说,他负责的游戏团队用 Midjourney 辅助做原画已经半年多,现在给 Midjourney 招了一个初级的美术,主要负责修改图片。接下来,他打算花更多钱请一位更资深的美术。
他觉得高级美术在大量手绘训练中已经熟悉了不同的风格,能与人工智能配合,高效地处理各种风格的图像需求,“节省出来的时间,可以去做更有价值的事”。
招聘需求也变了。一位正在找工作的游戏原画师说,过去一个月他面试了四家公司,每一家的业务面试官都会问他 AI 相关的问题。成都外包公司老板的态度更坚决,“团队再进人,肯定倾向于会 AI 的”。
身处这个行业的大多数人,已经开始接受 AI 是游戏制作的未来。一位前腾讯游戏中台的美术人士说,“用 AI 提升效率,是躲不掉的。”
他们期望用 AI 无法替代的资深人士,指挥 AI 做更复杂更好的产品,在这一轮技术演进里抢得先机。
至于 AI 接手初级工作后,一位年轻画师怎么在毕业后找到工作机会锻炼技法、提升基本功,“从初级变成高级”,胜任更复杂的工作。这是一个目前还没人能回答的问题。
AI 将如何改造创造性工作,游戏行业已经给出模糊的前景。这次技术改造不会停在游戏业。
本文作者:晚点LatePost,如需转载请联系作者,并注明出处:https://www.bailinghao.com/archives/10654