Appearance
AI 视频提示词工程:精炼与结构
一、提示词剪词法
AI 视频提示词常见的三大无效内容:
1. 剪掉情绪词
错误:高级感、电影感、唯美感 原理:这些词不是有效的控制信息,AI 无法将其转化为具体画面参数 正确做法:用能被保留的具体信息去体现效果(光线结构、色彩关系、空间布局)
2. 剪掉重复词
原理:同义反复不会叠加效果,只会分散权重 正确做法:每个信息只出现一次,控制力反而更集中
3. 剪掉人类句式
错误:写完整句子 → 像是在讲故事 正确做法:拆成单元 → 谁在动 + 怎么动 + 镜头固定还是跟随 模板:人物身份 + 场景氛围 + 情绪状态 + 主动作 + 辅助动态 + 身体联动 + 结束状态 + 简单镜头
二、反向提示词结构
AI 执行提示词是顺序执行的。正常顺序会导致动作和镜头被拆成不连贯的片段。
核心方法:镜头优先
正常(易断裂):一个人走进房间,坐下,镜头缓缓推进反向(更自然):低角度镜头缓缓推进,手持微晃,一个人走进房间坐下 → 所有角色动作都发生在镜头这个"容器"内部,产生"被拍摄感"。
以相机为参照系
AI 没有方向感(前/后),用镜头作为空间参照:
- ❌
角色向前走 - ✅
角色朝镜头走来/角色远离镜头/从画面左侧入镜,走入场景深处
三、90% 提示词无效的三大误区
误区1:堆砌无效描述
- 图生视频中,首帧权重最高
- 提示词描述的画面效果如果首帧已有,反而产生冲突
cinematic、photorealistic等风格词在视频生成中几乎无效
误区2:内容冲突
手持感 + 电影级平滑推轨→ AI 在两种逻辑间摇摆- 解法:写提示词前先确定一种主导逻辑(纪实/广告/情绪)
误区3:指令过多
- AI 视频生成本质是运动分配:动作越多,每个动作权重越低
- 解法:用时间轴分配运动,把角色/背景/镜头的运动拆到不同时间段
四、反推视频提示词
反推视频不要只截图,单帧不含运动信息。
三方法
- 反推生成过程:定位起始帧 → 爆发点 → 结束帧,让 AI 逆向推导变化序列
- 提取相机运动矢量:不要问"这个视频展示了什么",要问焦距如何变化、物理坐标如何偏移
- 参数化指令:感性描述(充满张力)→ 翻译为具体参数(
motion weight: high)
五、技能化提示词(Skill 封装)
将个人提示词工作流封装为可复用的 Skill:
- 打开 AI 工具,解释你的需求
- AI 自动拆解流程,告诉你需要准备什么素材
- 上传以往作品和常用提示词作为参考
- AI 生成结构化 Skill 文档
- 迭代测试 → 发现问题直接告诉 AI 修正
结果:其他人无需写提示词,AI 引导完成角色外观、性格、情绪选择 → 生成图像 → 自动分析图像生成视频提示词。