Skip to content

简介

Seedance 2.0 的提示词优化指南干货满满,实用性极强!我拆解了从分镜脚本、动作运镜到画质约束的全流程技巧。特别是对 @语法 的灵活运用以及视频编辑策略(延长/拼接/局部修改/首尾帧控制)的深入讲解,精准击中了 AI 视频创作中常见的“变脸、抖动、卡顿”等痛点。

字幕

00:00 今天和大家去分享一下集梦的c down赛 00:02 2.0的核心使用方法 00:03 那你掌握了这套方法之后 00:04 你就可以制作短句慢剧 00:07 真人剧 00:07 带货视频 00:08 这个方法都是非常通用的 00:10 那首先我们来看C档次2.0的一个核心内容 00:13 就是分镜脚本 00:15 那C档次2.0的底层 00:16 更接近空间与时间的解耦 00:19 那什么是空间和时间的解耦呢 00:21 就是他会按照时间进行切片 00:24 暂为每一段时间指定主体空间动作和镜头 00:28 那我们来看一个案例 00:29 那错误的写法是什么样子呢 00:31 就是你直接写一位咖啡师 00:33 在清晨的咖啡馆里头 00:34 有一只猫趴在柜台上 00:36 咖啡师正在冲泡手冲咖啡 00:39 如果你这样进行描述的话 00:41 给到CD的2.0 00:42 它出来的视频是非常糟糕的 00:44 非常假的 00:45 而且连贯性也非常的差 00:47 那应该怎么做呢 00:48 我们讲的是时序拆解 00:50 那我们看下头 00:51 这个 00:52 我们应该把我们的画面切成三个不同的时序 00:56 0~5秒 00:57 它的主体是什么 00:58 主体是咖啡师 00:59 空间是什么 01:00 动作是什么 01:01 景别是什么 01:02 接下来5~10秒 01:04 它的主体是什么 01:05 空间是什么动作是什么 01:07 视角是什么 01:07 最后10~15秒它的主体是什么 01:10 空间是什么动作 01:11 是什么视角是什么 01:13 当我们有了时序拆解的这套思路以后 01:17 那我们写出来的提示词应该是这个样子的 01:19 0~5秒中景固定咖啡师拿起手冲壶 01:23 然后水的样子是什么样子的 01:25 5~10秒是特写缓推 01:28 那描写咖啡滴入这个分享壶的一个过程 01:32 那最后就是10~15秒 01:33 近景横推又是什么样子的 01:36 这个就是我们说的时序拆解 01:38 那我们以一个具体的案例来看 01:41 我们看右边这个视频 01:43 右边这个视频在播放的时候 01:44 左边的高亮部分就是对应的它的一个提示词 01:47 我们可以看到5~10秒的时候是全景慢拉 01:51 10~15秒的是远景固定镜头 01:54 它就是远景固定镜头SDANCE2.0 01:57 对画面的掌控感是非常强的 01:59 所以0~5秒 02:00 5~10秒 02:02 10~15秒 02:03 我们应该是按这种方法去写 02:06 每一段时间内的镜头描写 02:08 每一段时间内的镜头描写 02:11 每一段时间内的镜头描写 02:13 这个就是我们说的时序化的 02:16 空间结构的表达方式 02:17 好我们来可以再看一遍 02:19 现在是5~10秒那个画面 02:21 接下来切到10~15秒的画面 02:23 这样写出来的提示词 02:24 画面和提示词是一一对应的啊 02:28 是非常有掌控感的好 02:30 接下来我们再看第二个方向是动作与运镜 02:33 动作语音镜直接影响到我们生成视频的质感啊 02:37 也决定了我们说的画面的一个呼吸感 02:39 那我们还是以刚才的案例 02:41 这个视频案例给大家去做一个演示 02:44 同样的是视频左边高亮部分 02:46 就是它接下来要生成的内容 02:48 首先我们来看第一个就是我们说的控制幅度 02:52 在写提示词的时候呢 02:54 我们想让动作有层次 02:55 有衔接 02:56 有温度 02:57 我们应该去用身体的细节去传达情绪 03:00 而非抽象的这种情绪标签 03:01 什么意思呢 03:02 当我们写动作的时候 03:04 我们要写缓步前行 03:06 轻抬手臂自然落座 03:09 这种小幅动作更容易被精准还原 03:12 我们可以看我写的是缓缓的抬起左手 03:15 拿起手套 03:17 微微的仰看天空 03:19 手臂平举 03:20 迎向俯冲下来的雄鹰好 03:22 我们来看这边它所能展示出来的效果就非常好 03:27 拿手套轻轻把手抬起来 03:30 应落下来对视 03:32 这个都是非常小的细节 03:34 我们用小幅度的细节才能更被精准的还原好 03:38 第二个就是每一个动作啊 03:41 要承接上一个动作的 03:42 于是从静止滑入到下一个动作 03:45 那这样会让我们的连贯性更好 03:48 比如说我的这一段借着手套的动作轻轻仰头 03:52 然后戴好手套平举 03:54 然后再上马 03:55 我们来看戴上手套 03:57 然后轻轻地平举 03:59 然后让鹰下来 04:01 这个每一个动作它是有衔接的 04:03 那这样写提示词啊 04:05 它的整体的效果就非常的好 04:07 那最后一个是以形传神 04:10 我们要以细微的这种变化来去展示画面的动作 04:14 什么意思呢 04:15 用可观察的身体语言代替悲伤 04:18 愤怒这种词汇 04:20 你在提示词里头写悲伤或者写愤怒 04:23 这样不好 04:23 我们应该用微表情啊 04:25 去让AI去还原我们当时的这种效果 04:29 比如说我写的就是嘴唇微颤 04:31 眼尾箭矢和肩头微耸 04:35 那比如说我这是嘴角微微上扬 04:37 眼神流露出与猛禽的默契 04:40 我们一会儿看一下它到底是什么意思 04:42 我没有写他很自豪等等这种词 04:45 看微微的笑 04:47 然后对视 04:48 这都是非常具体的动作 04:50 而我不会写 04:51 说他很自豪 04:52 这种是非常抽象的词语 04:53 好我们总结一下 04:54 其实我们在写提示词的时候 04:56 一定要注意 04:57 我们要写小幅度的动作 04:59 更容易被精准还原 05:00 我们要每一个动作的 05:01 于是连接下一个动作 05:03 我们要用可观察的身体语言代替悲伤 05:06 愤怒的词汇啊 05:07 这是动作的节奏 05:09 那同样我们还是以这个视频为例 05:12 我们来看一下运镜的规范是什么样子的 05:15 那整个CD2.0对中文的理解是非常深的 05:19 非常好的 05:19 那我们直接给出景别与运镜的指令生效 05:23 即可用精准的词去换稳定的画面 05:25 比如说同样的我们的视频对应的是左边高亮 05:29 同样我们来看整个画面 05:31 我会写上中景特写 05:32 远景缓推平移固定镜头 05:34 它的整体的展示就是按我的描述来的 05:37 同时我还可以加上推拉摇移环绕 05:40 不要在同一个时间进行堆砌 05:42 稳定性优先 05:43 同时当人物已经有抬手转身 05:46 上马俯冲之类大动作的时候 05:48 镜头反而应该收敛 05:50 让动作承接节奏 05:51 镜头承接观众的路径 05:53 这是它的一个运镜的规范 05:55 我们可以看到这个视频好 05:57 这是运镜规范 05:58 那我们接下来要讲的就是 06:01 我们了解了怎么去写它的分镜 06:04 怎么去写它的这镜头怎么去写他的动作 06:08 那在集梦CDX2.0中 06:10 还有一个非常重要能力叫多参考能力 06:13 就是让参考图各司其职 06:15 引擎 06:15 也就是c down2.0才能准确的去复刻你的意图 06:19 那什么意思呢 06:20 我们来看在整个C大赛2.0当中 06:23 是有四类参考素材的 06:24 分别是形象照 06:26 参考就是你可以传一个人物去锁定人物的外观 06:29 服装年龄 06:30 通常一到两张图就够了 06:32 避免同一个人物给太多复杂和冲突的图片 06:36 第二个是环境参考 06:37 你可以在视频当中去固定空间的气质 06:40 光线和材质啊 06:42 它不是装饰图 06:43 而是场景的一个固定器 06:44 同时还有动作参考 06:46 你可以提供视频去让我的接下来生成的内容 06:50 去参考视频中的动作 06:51 那重点是学会运动轨迹 06:53 而不是去复刻原视频的人物和场景 06:55 最后一个是声音参考 06:57 就是用背景音乐或者是环境声拉起情绪 07:00 尤其适合唱歌 07:01 要表演力或节奏非常强的这种剪辑内容 07:04 那我们稳妥的配置通常是4~5个素材 07:07 角色图一到两张场景图 07:09 一张运镜图 07:10 一张音频一张 07:11 然后素材并非越多越好 07:12 这个大家需要注意一下 07:14 好我们来直接看一个案例 07:1507:16 我们来看在集梦当中他怎么做 07:17 就像我们刚才所说的 07:19 0~5秒中景镜头固定 07:20 然后我爱的素材男主站的中央 07:23 然后接下来我们说5~10秒该做什么 07:26 10~15秒该做什么 07:27 这都符合我们刚才所讲的所有内容 07:30 那最关键的是我们在最后会艾特一个音频 07:33 这个音频我已经用AI生成的 07:35 我们可以放一下一张泛黄的照片 07:40 模糊了面容 07:4207:42 这个音频输入到集梦中的时候 07:44 我会告诉他要男主演唱的歌曲 07:47 就是这首歌节奏要和这首歌一致 07:49 男主要唱出这首歌 07:50 那我们看一下视频 07:51 他是否真的唱出了这首歌 07:56 一张泛黄的照片模糊了面容 08:03 一段雨后的味道刺穿了时空 08:08 OK这就其实说明了整个我们的集梦 08:11 C3的2.0 08:12 他的能力是非常强大的 08:13 它能参考图片 08:14 他同时还能参考音频 08:15 那我们刚才看到了整个c on2.0的效果 08:18 就是我们现在所看到的这个内容 08:20 那多图参考的时候呢 08:22 谁是女主 08:23 谁的动作 08:23 谁是参考啊 08:25 是否出现这个呃 08:26 音频 08:27 我们都可以在这个地方 08:28 用at的形式去把它展示出来 08:30 好还有接下来我们去分享的是延展和拼接 08:34 当我们都知道在做CDUX2.0的时候 08:37 我们想做长视频 08:38 也就是15秒以上的视频 08:40 那长视频它的对话是持续的 08:42 情绪是层层递进的 08:43 单一空间内还有位移 08:45 那我们也要追求一气呵成 08:47 然后适合3~45秒的不断的叙事 08:50 那我们做长视频的话 08:51 我们应该怎么做呢 08:52 应该去用下一个功能叫艾特视频 08:55 向后移平移N秒 08:57 保持角色的外观 08:58 镜头动作节奏和空间的一致性 09:01 那做短视频 09:02 其实我们就不需要去用艾特视频一了 09:05 我们直接进行多个15秒的生成 09:08 然后拼接起来 09:09 那总结就是文戏优先延长 09:12 五系优先拼接 09:13 前者是为了延续情绪 09:15 后者是啊可以有更多的这个可控的冲击 09:18 那是什么意思呢 09:19 我们给大家去直接在集梦当中看一个例子 09:22 我们来看这个案例 09:23 当我们要做一个15秒以上的视频 09:26 并且让这个视频是有非常好的连续感 09:28 应该怎么做呢 09:29 那我举个例子 09:30 首先我要在这个地方 09:31 按照我们刚才所讲的生成一个15秒的视频 09:34 比如说0~3秒4~7秒 09:36 8~12秒 09:37 13~15秒生成的一个视频 09:39 好这个视频生成完了以后呢 09:42 我们可以看他最后的结尾处 09:44 一个男的拉着一个女生跑出了这个门 09:48 那这个视频做完了以后 09:49 我就可以把这个视频下载下来了以后 09:51 我再这个地方写着 09:54 将刚才下载的视频延长15秒 09:56 也就是将刚才生成的视频 09:58 作为下一个15秒的开头 10:00 让他去参考啊 10:02 延长15秒 10:03 保持电影风格 10:04 屏幕色调都一致 10:06 继续生成一个视频 10:08 那这个生成的视频就会延续 10:10 刚才的视频的最后一帧 10:12 你看刚才的视频的最后一帧 10:13 是女生拉着男生从门里头跑出来 10:17 那这个就是我们刚才看到的这个内容 10:20 好从门里头跑出来 10:21 那我们艾特了视频以后 10:24 他最后生成的效果也是这个样子 10:26 开第二个视频的开头 10:28 就是女生拉着男生从门里头跑出来 10:30 这是因为我们延长了视频好 10:32 我们具体当这两个视频生成了以后 10:35 我们怎么将它进行拼接 10:37 这是一个非常重要的点啊 10:39 这个时候就来到了我们的剪映 10:41 当然你也可以用龙虾帮大家去自己剪 10:44 那我之前做的一个奥特曼的爆款视频 10:46 就是龙虾自己帮我一键出剪辑的 10:49 我们可以看到这个是我们第一段生成的视频 10:52 也就是我们所看到的这一段生成的视频 10:56 好这段视频生成完了以后 10:57 我刚才也给大家去说了 10:58 我在第二段视频的时候去艾特第一段视频 11:01 那它所产生的效果是什么样子呢 11:03 就是第一段视频的结尾的地方 11:06 我们来我们可以观看一下 11:07 第一段视频的结尾的最后一帧 11:09 跟第二段视频开头的第一帧是完全一样的 11:14 但是当我们去做这些事情 11:16 我们会发现一个问题 11:17 我们放大来看这个视频好 11:19 我们从最后一帧看好 11:21 我们可以看到这个地方会有一个卡顿 11:24 好这个就是地方会有个卡顿 11:26 我们再看一遍卡顿 11:28 对它会有个卡顿 11:29 为什么 11:30 因为它是有一个冗余的内容 11:33 第一个视频的最后一段和第二个视频的开头 11:36 中间这两个进行了重复 11:38 会有冗余 11:39 那为了让这个视频变得更流畅 11:41 我们需要将第一个视频的后一段往回拉一下好 11:46 这样他的冗余就会消失 11:4811:48 我们可以看第一段和第二段 11:50 完美的衔接到了一起 11:52 我们再来看一遍好这个完美的衔接到了一起 11:58 同样我们在第二个视频生成的时候呢 12:00 我们也会生成下一段视频的时候 12:04 我们会将第二段视频的最后一段 12:07 和第三段视频的第一段继续进行延长 12:10 那它所延长的效果就是我们所看到的这个地方 12:13 突发大火 12:14 火势猛烈 12:1612:16 我们可以看第二段的最后和第三段的开头 12:21 也会有一个重复 12:23 那如果我们不进行冗余处理的话 12:25 它也会有一个小小的卡顿 12:27 爆裂好 12:28 它会有个闪屏 12:29 所以我们的做法是将第二段的开头往回拉一点 12:3312:34 再看一下我火势猛烈 12:36 好这样第二段和第三段也就衔接起来了 12:39 那最终我们将这三段拼接起来 12:41 就会是一个非常流畅的视频 12:43 OK我们来看第一段和第二段的衔接 12:46 和第二段和第三段的衔接就非常的自然 12:49 刚才我们看到的就是c dos2.0 12:51 给我们提供了一个非常强大的技能 12:54 就是将视频一向后延长多少秒 12:57 保持人物角色镜头动作和空间的一致性 13:00 然后再通过剪辑或者龙虾的自动剪辑 13:02 就能拼接成一个非常长的视频 13:04 好我们还是要记住文系优先延长武器 13:07 优先拼接好这个原理 13:10 那最后和大家去分享的两个内容 13:13 第一个是局部与首尾针 13:15 在集梦当中我们也可以去替换人物 13:18 调整这个道具和修整瑕疵 13:21 在保持画面其余部分不变的前提下 13:24 做一些精准手术 13:25 同时我们在时间和空间绑定的时候 13:28 我们不要只说去改这个人 13:30 我们要告诉吉梦说 13:32 在第几秒的哪一个画面进行修改 13:34 那同时它还有一个首尾针 13:36 我们可以指定开始的第一帧是什么 13:39 也可以指定最后结束的那一帧是什么 13:42 也可以进行指定 13:43 这就是局部与首尾针的一个整体功能 13:46 那在最后的最后 13:47 我们总结一下 13:48 当我们做AI短视频的时候 13:50 还有一个内容是必须得加的 13:52 在每一段提示词后面 13:54 我们都要加上面部稳定不变形 13:56 五官清晰 13:57 人体结构正常 13:58 动作自然流畅不僵硬 13:59 画面无卡顿和无闪烁 14:01 只要涉及到人物出现的时候 14:03 我们加上这个提示词以后 14:04 他就会非常的稳定 14:06 所以建议大家在设计人物出镜的内容的时候 14:09 在这个指令的末尾添上一个指令锚定语 14:12 就是我们现在给大家所展示的 14:14 那这个就可以让你的画面更好的稳定 14:17 我们抽卡的次数和成本也会进行降低 14:20 好我们总结一下 14:22 那我们掌握了这个内容以后 14:23 你的下一支视频应该是从分镜开始的 14:26 就是我们说的把时间切成片段 14:29 给每个片段一个明确的视群指令 14:31 然后让参考图各司其职 14:33 各就各位用延长或者是组织的形式串联起来 14:37 叙事 14:37 再以定帧锁定首尾风格与故事进行统一 14:41 从而进行结构化的内容的输出

基于 Obsidian + VitePress 构建