Skip to content

AI 视频一致性控制:产品与场景

AI 视频模型本质上是概率生成系统,它不知道"同一个产品/场景"是什么——每一帧都是一次重新猜测。以下方案通过结构化约束来解决这个问题。


一、产品一致性(刺猬星球super-i)

核心原理

AI 不知道什么是"同一个产品",它只根据信息判断"像不像"。模糊信息(仅文字提示/一张产品图)必然导致每帧变化。

方法一:几何形状替代法(最精准)

  1. 忘掉产品本身,用几何形状代替(如圆形/方形)
  2. 先生成一组包含该几何形状的画面
  3. 用这组图生成视频
  4. 每隔一秒导出静帧画面
  5. Banana 工具把产品替换上去
  6. 把替换后的画面丢给可灵 Mini 做参考 → 稳定输出

方法二:直接替换法(快速但精度较低)

  1. 用 Banana 直接生成一张替换后的图
  2. 用这张图 + 原视频给可灵 Mini 修改

二、场景一致性方案

方案 A:720° 全景图法(球球乁爱撒娇)

工具推荐:RunningHub(RHTV)— 每天免费生成 3 张全景图

流程

  1. 导入场景图 → 生成 720° 全景图
  2. 进入预览模式,拖动截取多张不同角度
  3. 结合人物设定图 → 统一分镜
  4. RHTV 内置 4 格/12 格视角截图

方案 B:GPT-image2 空间推理法(球球乁爱撒娇)

GPT-image2 在空间推理方面有显著优势:

  • 输入室内场景 → "生成房间内部结构的俯视图"
  • 可以基于单张图生成不同镜头角度
  • Nano Banana 等工具无法实现同等效果

方案 C:3D 建模锁定空间结构(A厂孢子哥)

最彻底的方案——用 3D 建模锁定空间结构,AI 只负责渲染

  1. 用 3D 软件(如酷家乐/腾讯混元 3D)搭建场景
  2. 精确摆放家具、角色,设置摄像机机位
  3. 线稿 → 图生图模型增加风格
  4. 替换人物角色
  5. 得到一致性强的首尾帧 → 丢给 Seedance 生成
  6. 优点:多角度切换时布局绝对合理,不再抽卡

3D 工具推荐

  • 酷家乐(上手门槛低,半小时搭建一个房间)
  • 腾讯混元平台生成 3D 后导入自定义工具

三、三图控制法:Storyboard Pipeline(居鲁仕)

用三张参考图锁定输出的确定性,类似影视行业的分镜流程:

三张核心参考图

参考图作用说明
原图限定风格与场景画面整体风格基调
身份版(角色设定板)锁定角色细节多姿态、眼睛/爪子/毛发等微特征,相当于角色档案
故事版(分镜版)控制景别与运动每格标注动作方向、镜头运动、光影方向

颜色编码系统

颜色代表含义
🟠 橙色高光/轮廓光光照方向
🔴 红色肢体运动主体动作方向
🔵 蓝色摄影机运动镜头移动方向

流程

  1. 制作身份版提示词 → 生成角色设定板
  2. 制作故事版提示词 → 生成 12 宫格分镜
  3. 制作视频提示词 → 连接三张参考图 + 提示词 → 生成视频

场景适配工具

需求推荐工具
人物近景角色脸部三视图
多视角一致性波奇位九宫格
简单运动镜头角色三视图
商品广告产品算式图

参考来源

  • Clippings/已归档/2026-05-30-超简单!一招搞定 AI视频 的产品一致性.md
  • Clippings/已归档/2026-05-30-AI视频场景一致性新思路:全景图、GPT-image2与3D转绘拆解.md
  • Clippings/已归档/2026-05-30-破解AI视频场景一致性问题,场景一致性超顶方案,只需5分钟。.md
  • Clippings/已归档/2026-05-30-告别视频抽卡,这两张图你要知道!.md

基于 Obsidian + VitePress 构建