Appearance
AI 视频一致性控制:产品与场景
AI 视频模型本质上是概率生成系统,它不知道"同一个产品/场景"是什么——每一帧都是一次重新猜测。以下方案通过结构化约束来解决这个问题。
一、产品一致性(刺猬星球super-i)
核心原理
AI 不知道什么是"同一个产品",它只根据信息判断"像不像"。模糊信息(仅文字提示/一张产品图)必然导致每帧变化。
方法一:几何形状替代法(最精准)
- 忘掉产品本身,用几何形状代替(如圆形/方形)
- 先生成一组包含该几何形状的画面
- 用这组图生成视频
- 每隔一秒导出静帧画面
- 用 Banana 工具把产品替换上去
- 把替换后的画面丢给可灵 Mini 做参考 → 稳定输出
方法二:直接替换法(快速但精度较低)
- 用 Banana 直接生成一张替换后的图
- 用这张图 + 原视频给可灵 Mini 修改
二、场景一致性方案
方案 A:720° 全景图法(球球乁爱撒娇)
工具推荐:RunningHub(RHTV)— 每天免费生成 3 张全景图
流程:
- 导入场景图 → 生成 720° 全景图
- 进入预览模式,拖动截取多张不同角度
- 结合人物设定图 → 统一分镜
- RHTV 内置 4 格/12 格视角截图
方案 B:GPT-image2 空间推理法(球球乁爱撒娇)
GPT-image2 在空间推理方面有显著优势:
- 输入室内场景 → "生成房间内部结构的俯视图"
- 可以基于单张图生成不同镜头角度
- Nano Banana 等工具无法实现同等效果
方案 C:3D 建模锁定空间结构(A厂孢子哥)
最彻底的方案——用 3D 建模锁定空间结构,AI 只负责渲染:
- 用 3D 软件(如酷家乐/腾讯混元 3D)搭建场景
- 精确摆放家具、角色,设置摄像机机位
- 线稿 → 图生图模型增加风格
- 替换人物角色
- 得到一致性强的首尾帧 → 丢给 Seedance 生成
- 优点:多角度切换时布局绝对合理,不再抽卡
3D 工具推荐:
- 酷家乐(上手门槛低,半小时搭建一个房间)
- 腾讯混元平台生成 3D 后导入自定义工具
三、三图控制法:Storyboard Pipeline(居鲁仕)
用三张参考图锁定输出的确定性,类似影视行业的分镜流程:
三张核心参考图
| 参考图 | 作用 | 说明 |
|---|---|---|
| 原图 | 限定风格与场景 | 画面整体风格基调 |
| 身份版(角色设定板) | 锁定角色细节 | 多姿态、眼睛/爪子/毛发等微特征,相当于角色档案 |
| 故事版(分镜版) | 控制景别与运动 | 每格标注动作方向、镜头运动、光影方向 |
颜色编码系统
| 颜色 | 代表 | 含义 |
|---|---|---|
| 🟠 橙色 | 高光/轮廓光 | 光照方向 |
| 🔴 红色 | 肢体运动 | 主体动作方向 |
| 🔵 蓝色 | 摄影机运动 | 镜头移动方向 |
流程
- 制作身份版提示词 → 生成角色设定板
- 制作故事版提示词 → 生成 12 宫格分镜
- 制作视频提示词 → 连接三张参考图 + 提示词 → 生成视频
场景适配工具
| 需求 | 推荐工具 |
|---|---|
| 人物近景 | 角色脸部三视图 |
| 多视角一致性 | 波奇位九宫格 |
| 简单运动镜头 | 角色三视图 |
| 商品广告 | 产品算式图 |
参考来源
- Clippings/已归档/2026-05-30-超简单!一招搞定 AI视频 的产品一致性.md
- Clippings/已归档/2026-05-30-AI视频场景一致性新思路:全景图、GPT-image2与3D转绘拆解.md
- Clippings/已归档/2026-05-30-破解AI视频场景一致性问题,场景一致性超顶方案,只需5分钟。.md
- Clippings/已归档/2026-05-30-告别视频抽卡,这两张图你要知道!.md