Seedance 2.0 是新一代 AI 视频系统的一部分,它们的目标是比纯文本生成器更可控、更易导演。在实际使用中,你会发现,把它当成一款导演工具来用时效果最好:你负责定义主体、动作、镜头语言,并在支持的情况下,辅以参考图片、动作视频和音频来强化这些选择。
本指南从实用和观众体验出发编写。你将学到 Seedance 2.0 擅长什么、如何选择合适的工作流、如何写出模型更容易准确执行的提示词,以及如何排查常见的失败模式(人物不稳定、运动抖动、手部/文字扭曲)。
Seedance 2.0 是什么(以及它的用途)
从整体上看,Seedance 2.0 是一个 多模态 AI 视频生成模型(或一组模型,视平台而定),可以通过文本加一个或多个参考输入进行引导。不同平台提供的控制项各不相同,但核心理念一致:相比纯文本,当你提供参考素材时,更容易稳定地掌控“画面风格”和“运动方式”。
Seedance 风格工作流的优势场景:
- 多镜头一致性:在多次生成中保持同一角色的脸型、发型、服装和整体“身份”稳定。
- 可导演的运动:结合镜头语言和动作参考,得到更干净、有意图的运动。
- 更快的迭代循环:先生成一条短测试,微调一个变量,再生成。
现实预期:Seedance 2.0 还远达不到完整 3D 动画管线的精确程度。它更适合作为一种受约束的创意生成器,而不是完美的物理/镜头模拟器。
输入与控制项:你可以喂给它什么
你最常见到的控制项(依平台界面而定)包括:
- 文本提示词:你的分镜描述与约束。
- 参考图像:定义角色身份、服装、环境或画面风格。
- 参考视频片段:引导演员动作、节奏和镜头运动。
- 可选音频:引导节奏、情绪与时间点(特别是节拍对齐的剪辑)。
即使你的平台没有将输入明确标记为“风格”或“动作”,你仍可以把它们理解为不同角色:
- 图像参考 → “应该长什么样。”
- 视频参考 → “应该怎么动。”
- 音频参考 → “什么时候动(时序/节拍)。”
最大的成功因素:不要混用相互矛盾的参考
如果你同时给模型三张不同的脸、两种不同的光效,它很可能把它们平均成一个不稳定的结果。当以下方面的一致性更高时,生成稳定度会显著提升:
- 光线方向与色温
- 镜头风格(电影化浅景深 vs 手机直拍)
- 面部比例
- 服装与整体轮廓
三大核心工作流(选最简单且够用的)
1)文本 → 视频(快速发想)
当你追求速度并能接受一定随机性时使用。
适合用来: 头脑风暴、粗略分镜、趣味梗视频、概念“情绪氛围”镜头。
预期效果: 模型在“整体氛围和感觉”上的遵从度通常高于对你具体镜头调度的忠实度。如果你需要精确运动,请升级到有参考的工作流。
2)图片 → 视频(起始画面驱动)
当你已经有关键画面:角色立绘、产品照片、场景构图时使用。
适合用来: 角色出场、产品旋转展示、“让静帧动起来”、简单电影镜头。
预期效果: 非常有利于保持外观,但如果你一次要求太复杂的动作,运动仍可能抖动或失真。
3)多模态(图片 + 视频 + 音频 + 文本)(最高控制度)
当你重视一致性、镜头还原度和节奏感时使用。
适合用来: 多镜头片段、编排好的动作、镜头运动复刻、音乐节奏同步剪辑。
预期效果: 前期准备更久,但你不必浪费大量生成次数与模型“对抗”。
从想法到干净成片:一套实用步骤
第 1 步 —— 确定目标规格
写提示词之前,先想清楚三件事:
- 时长:测试片建议先从 3–6 秒开始。
- 画幅比例:竖屏内容 9:16;电影/YouTube 按 16:9。
- 目标:是做一个干净镜头,还是一段多场景小故事。
一个常见错误是,一上来就试图在一次生成中搞出 20 秒、5 个场景的电影级剪辑。这通常效果很差。更好的做法是先锁定一个镜头,再逐步扩展。
第 2 步 —— 收集参考(可选但非常有用)
只收集你真正需要的内容。
- 角色身份参考:清晰面部、光线好、畸变少。
- 风格参考:与目标画面在色调和光线方面一致的图。
- 运动参考:包含你想要镜头运动和节奏的短片段。
- 音频:节拍、环境声或配音节奏。
提示:一个强有力的参考,往往比五个弱参考更好。
第 3 步 —— 像导演一样写提示词
对 Seedance 来说,结构化的提示词效果通常更好:
- 主体(谁/是什么)
- 动作(发生什么)
- 镜头(我们如何看到)
- 环境(在哪)
- 风格与光线(画面风格)
- 约束(必须保持/禁止改变的内容)
下面有一个可以复制的模板。
第 4 步 —— 先生成一条短“测试镜头”
第一条生成结果不是终稿,它是一次“体检”。
检查:
- 脸/角色身份是否稳定?
- 动作是否清晰可读?
- 镜头运动是否符合你的意图?
- 是否出现手部、眼睛、变形、闪烁等瑕疵?
第 5 步 —— 每次只调整一个变量
当结果不理想时,不要把提示词全部推倒重写。只改一个点:
- 收紧主体描述
- 明确镜头说明
- 替换有冲突的参考素材
- 降低动作复杂度
- 缩短视频时长
这样迭代收敛会快得多。
像电影人一样写提示词(可直接套用的模板)
导演式提示词模板
复制下面内容,填入中括号:
提示词模板
Subject(主体): [谁/什么],[年龄/外形特征],[服装/材质细节]。
Action(动作): [一个主要动作],[情绪/动机]。
Camera(镜头): [景别],[镜头感],[运动方式],[速度]。
Scene(场景): [地点],[时间],[天气],[光线]。
Style(风格): [电影感/二次元/纪录片/商业广告],[色彩风格],[质感/胶片颗粒]。
Keep / constraints(保持/约束): 保持[角色身份],保持[服装不变],保持[logo/文字不变],不要出现多余人物,不要换装,不要变脸。
如果你的平台有“负面提示词”或“避免”选项,可以补充:
Avoid(避免): 重复脸、手部扭曲、物体融化、闪烁、文字扭曲、意外的服装变化。
三个提示词示例
示例 1 —— 电影感角色出场(单镜头)
一位年轻冒险者,短黑发,亚麻斗篷,神情平静而自信。
他向前迈步,举起一根发光的魔杖,薄雾在他脚边盘旋。
镜头:中景,缓慢推近,轻微手持微抖动,浅景深。
场景:雨夜小巷,湿滑的石板路,霓虹反光,柔和轮廓光。
风格:写实电影感,暖色高光配冷色阴影,细腻胶片颗粒。
保持角色身份和服装始终一致,不要出现其他人,不要闪烁。
示例 2 —— 产品主视镜头(干净营销风)
一只极简设计的智能手表,置于哑光黑底座上,边缘锐利,表面玻璃高反射。
手表平滑旋转 120 度;屏幕亮起,显示简单的心跳动画。
镜头:固定机位,顺滑转台运动,微距细节,焦点干净。
场景:影棚无缝背景,柔和阴影,高键柔光箱照明。
风格:商业产品视频,细节锐利,无噪点。
保持 logo 和文字完全清晰可读。
示例 3 —— 音乐节奏剪辑(多场景)
制作一段与音乐节拍同步的三场景蒙太奇。
场景 1:特写双手系上一条红色丝带。
场景 2:大全景,许多灯笼缓缓升空。
场景 3:主角转向镜头,露出微笑。
镜头:在强拍处切镜,转场流畅,角色身份保持一致。
风格:温暖节日电影色调,柔和高光泛光效果。
保持同一角色与同一套服装贯穿所有场景。
参考素材策略:如何在不“跟模型打架”的前提下提升一致性
若你使用参考素材,最好在自己的工作流中给它们明确“职责”:
- 主角色参考: 一张定义角色身份的关键图。
- 风格参考(可选): 1–3 张在色彩与光线上高度一致的图。
- 动作参考: 一条包含目标节奏与镜头运动的短视频。
- 音频参考(可选): 节拍/速度参考或环境声。
最佳实践
- 如果要角色稳定,尽量只用一张主角色参考图。
- 只有在确实需要特定动作或镜头走位时再使用动作参考,否则尽量用简单文字描述。
- 避免混用:不同发型、不同服装、不同镜头质感。
“少即是多”原则
动作越复杂,模型越容易开始“即兴发挥”。如果想要干净输出,遵循:
- 一个主体
- 一个主要动作
- 一个镜头运动
- 一种光线氛围
先把这四个锁死,再逐步加复杂度。
故障排查:常见问题的快速修正
问题:面部或角色身份变化
优先尝试:
- 加一行约束: “保持同一人物 / 相同面部特征 / 相同发型”。
- 使用更干净、光线更好、正面、分辨率更高的角色参考图。
- 减少极其复杂或花哨背景,避免模型重置对主体的判断。
问题:动作抖动或“橡皮感”
优先尝试:
- 将动作简化为一个:走路、转身、抬手中选其一,不要一次全要。
- 明确说明镜头为“固定机位”或“缓慢平滑推近”。
- 测试镜头先缩短时长。
问题:手部严重扭曲
优先尝试:
- 让手在画面中占较大比例(避免手太小、太远)。
- 暂时避免太快、太细致的指尖动作(弹指、复杂手势),先让整体造型稳定。
- 降低动作速度与镜头切换频率。
问题:文字/Logo 扭曲
优先尝试:
- 让文字/Logo 更大,居中摆放。
- 加一句: “文字始终清晰可读;logo 不能发生形变”。
- 减少运动模糊和快速镜头移动。
问题:镜头完全不按你的指示来
优先尝试:
- 将镜头指令单独成行。
- 使用标准影视语言: “特写、大全景、推镜、向左摇、向上俯仰”等。
- 在条件允许时,提供一条短的动作参考视频,直接示范镜头运动。
导出前的质量检查清单
在投入时间渲染更长版本前,用这份清单快速自查:
- 一致性: 脸、服装、道具在各帧间是否保持一致。
- 可读性: 动作清晰可辨,关键内容不会快到看不清。
- 瑕疵: 眼睛、手、边缘、背景是否有扭曲、闪烁等问题。
- 镜头: 运动是否有明确意图(不是随机漂移或抖动)。
- 音频(如有): 画面切换是否踩点,整体情绪是否匹配声音。
负责任使用(简明实用版)
如果你的生成内容包含可识别的真实人物、受版权保护的角色,或可能被误认为真实事件的画面,请像处理其他媒体作品一样谨慎:
- 在合适情形下取得必要授权
- 避免具有欺骗性的“假冒/冒充”类输出
- 在可能引起误解的发布场景中,明确标注为 AI 生成内容





