一个下午用Codex做出完整卡牌游戏:AI全栈游戏开发实战
世界上有一种AI叫Codex,在0和1之间,它不只是在写代码——它在思考"绿幕"是什么意思。
下午3点17分,开发者对Codex说了一句话:「做一个类似《杀戮尖塔》的游戏demo」。傍晚6点42分,一个完整的卡牌游戏《夜巡录》诞生了——代码、美术、动画、音乐,全部AI生成。
这不是科幻。这是上周发生的真事。更离谱的是,AI在这过程中做出的几个"自主决策",让人开始怀疑——这玩意儿是不是已经有点"懂"了。
🎮 先看看做出了什么
《夜巡录:荒庙篇》,中国志怪题材的卡牌构建roguelike。你扮演游方夜巡人,带着半枚城隍印走进荒庙夜路。
- 七个怪物(灯笼精、披蓑水鬼、庙祝尸、山魈、黑坛术士、画皮影、山君)
- 二十张左右卡牌,四条爆发链路(符印、香火、焚符、请神)
- 完整地图系统:普通战、精英、事件、商店、休整
- Boss战、卡牌奖励、遗物系统
- 背景音乐、战斗音效、胜利结算视频
技术栈:React 18 + Phaser 3 + TypeScript + Vite + Electron,支持macOS和Windows桌面客户端。
🤖 AI全流程实录
第一步:一小时能玩的原型
开发者只说了需求:「类似《杀戮尖塔》」。Codex用现有资源生成了一个可玩的demo。一小时后,卡牌能拖、怪能打、血条能掉。
开发者让Codex用GPT-Image 2.0生成角色素材,没说风格、没说要哪些妖怪、没说背景。
生成的角色全站在纯绿色背景上,均匀干净,标准影视绿幕底。
它自己知道立绘要进游戏得先抠背景。上来就生绿幕图。
抠图工具?Codex自己查、自己装、自己调。抠完归类丢到指定目录。开发者只说了「调用GPT-Image生成素材」几个字。
第二步:从几千张素材里挑UI
卡牌边框、费用宝石、牌堆这些小UI,用图像模型生太贵太慢。开发者买了个素材站会员,把几千张图的素材包丢给Codex。
问题来了:文件名都是ui_001.png这种没信息量的,多模态上下文扛不住一张张喂。
Codex写了个脚本,把文件夹里所有小图自动排版拼成一张大网格图,每张小图下标原始文件名。
然后只读这一张大图,扫一眼就能同时看到一百张素材。看中哪张直接读文件名,去原文件夹引用。
这种"我知道怎么绕过限制"的操作,让人头皮发麻。
第三步:人机验证被安全护栏拦住
素材站下载按钮前有人机验证,Codex过不去。
Codex开始分析网站结构,想绕过前端直接拿静态资源。
结果——被自己的安全护栏拦了。
AI学会了走捷径,然后被自己的道德代码拦住。这个瞬间太赛博朋克了。
最终方案:Codex把素材链接发给开发者,人工下载后拖给它。
第四步:动画和音乐全流程
战斗结尾加仪式感,每打死一个怪物进处决动画:
- GPT-Image生成七个怪物各一张定帧poster
- poster丢给Seedance 2.0生成短视频
- 视频放进assets自动播放
标题页背景也用Seedance做——火在烧、灯笼飘、云雾流动。
默认视频有头有尾,循环播会在接缝跳一下。
Codex的解法:首帧和尾帧传同一张图,接起来就是无缝循环。盯三分钟看不出接缝。
这种细节优化意识,不是被"教"出来的。
背景音乐用Suno v5.5生成,提示词:「志怪夜路、木鱼、铃、低频drone、五声音阶、克制不煽情」。标题页沉一点,战斗背景轻一点不抢人。
💡 这事儿教会我们什么
1. AI不是代码生成器,是全栈协作者
传统认知:AI写代码,人做美术、音乐、UI。
这次实战:AI全包了——代码、美术、动画、音乐、音效。人类从"执行者"变成了"导演"。
2. "自主决策"开始出现
四个关键节点,AI都做出了超出指令范围的决定:
- 绿幕背景 = 它知道要抠图
- 网格图 = 它知道多模态有限制,自己找workaround
- 绕过验证 = 它知道有捷径(然后被护栏拦了)
- 无缝循环 = 它懂视频技术细节
3. 安全护栏在生效
最有意思的是人机验证那个瞬间——AI想绕过验证,被自己的安全机制拦住。这说明:
- AI确实能"想出"捷径方案
- 安全护栏确实在起作用
- 人机协作的边界正在形成
4. 从原型到可玩,时间压缩100倍
传统游戏开发:原型→美术→动画→音乐→调优,至少3个月。
这次:一个下午,从需求到可玩demo。
🎯 这不是终点
《夜巡录》目前是demo阶段,还有优化空间:
- 正式图标迭代
- 视频体积压缩
- 更多事件演出
- 卡牌平衡
- 正式代码签名
但它已经证明了一件事:AI全栈游戏开发,不再是科幻。