AI 视频提示词工程：精炼与结构

一、提示词剪词法

AI 视频提示词常见的三大无效内容：

1. 剪掉情绪词

错误：高级感、电影感、唯美感原理：这些词不是有效的控制信息，AI 无法将其转化为具体画面参数 正确做法：用能被保留的具体信息去体现效果（光线结构、色彩关系、空间布局）

2. 剪掉重复词

原理：同义反复不会叠加效果，只会分散权重 正确做法：每个信息只出现一次，控制力反而更集中

3. 剪掉人类句式

错误：写完整句子 → 像是在讲故事 正确做法：拆成单元 → 谁在动 + 怎么动 + 镜头固定还是跟随模板：人物身份 + 场景氛围 + 情绪状态 + 主动作 + 辅助动态 + 身体联动 + 结束状态 + 简单镜头

二、反向提示词结构

AI 执行提示词是顺序执行的。正常顺序会导致动作和镜头被拆成不连贯的片段。

核心方法：镜头优先

正常（易断裂）：一个人走进房间，坐下，镜头缓缓推进反向（更自然）：低角度镜头缓缓推进，手持微晃，一个人走进房间坐下 → 所有角色动作都发生在镜头这个"容器"内部，产生"被拍摄感"。

以相机为参照系

AI 没有方向感（前/后），用镜头作为空间参照：

❌ 角色向前走
✅ 角色朝镜头走来 / 角色远离镜头 / 从画面左侧入镜，走入场景深处

三、90% 提示词无效的三大误区

误区1：堆砌无效描述

图生视频中，首帧权重最高
提示词描述的画面效果如果首帧已有，反而产生冲突
cinematic、photorealistic 等风格词在视频生成中几乎无效

误区2：内容冲突

手持感 + 电影级平滑推轨 → AI 在两种逻辑间摇摆
解法：写提示词前先确定一种主导逻辑（纪实/广告/情绪）

误区3：指令过多

AI 视频生成本质是运动分配：动作越多，每个动作权重越低
解法：用时间轴分配运动，把角色/背景/镜头的运动拆到不同时间段

四、反推视频提示词

反推视频不要只截图，单帧不含运动信息。

三方法

反推生成过程：定位起始帧 → 爆发点 → 结束帧，让 AI 逆向推导变化序列
提取相机运动矢量：不要问"这个视频展示了什么"，要问焦距如何变化、物理坐标如何偏移
参数化指令：感性描述（充满张力）→ 翻译为具体参数（motion weight: high）

五、技能化提示词（Skill 封装）

将个人提示词工作流封装为可复用的 Skill：

打开 AI 工具，解释你的需求
AI 自动拆解流程，告诉你需要准备什么素材
上传以往作品和常用提示词作为参考
AI 生成结构化 Skill 文档
迭代测试 → 发现问题直接告诉 AI 修正

结果：其他人无需写提示词，AI 引导完成角色外观、性格、情绪选择 → 生成图像 → 自动分析图像生成视频提示词。

AI 视频提示词工程：精炼与结构 ​

一、提示词剪词法 ​

1. 剪掉情绪词 ​

2. 剪掉重复词 ​

3. 剪掉人类句式 ​

二、反向提示词结构 ​

核心方法：镜头优先 ​

以相机为参照系 ​

三、90% 提示词无效的三大误区 ​

误区1：堆砌无效描述 ​

误区2：内容冲突 ​

误区3：指令过多 ​

四、反推视频提示词 ​

三方法 ​

五、技能化提示词（Skill 封装） ​

关联笔记 ​