写AI视频提示词,本质上是在当导演。你不只是在告诉AI“画什么”,更是在指挥“怎么拍”。很多人生成的视频画面呆板,问题就出在这里:只描述了静态的画面,忘了动态的场景和镜头。
想让视频“动”起来,主要靠两件事:一是描述清楚场景里发生了什么,二是明确告诉AI你的摄像机要怎么动。
怎么描述动态场景?用最直接的动词。
AI理解不了太复杂的文学性描述,所以要用简单、直接的动作词来描绘场景。忘掉形容词堆砌,把重点放在“谁”在“做什么”。
一个基本的公式可以是:主体 + 动作 + 场景。
- 别说:“一个男人在办公室里。”
- 要说:“一个男人在键盘上快速打字,眉头紧锁。”
第二个版本包含了具体的动作“快速打字”和细节“眉头紧锁”,这给了AI明确的动态信息。
再举个例子,你想生成一个下雨的场景。
- 普通描述:“窗外在下雨,一个女人在喝咖啡。” 这个描述太静态了,AI可能会生成一张GIF动图,只有雨滴在动。
- 动态描述:“雨点敲打着窗户玻璃,滑下水痕。一个女人慢慢举起咖啡杯,吹散了上面的热气。”
看到区别了吗?“敲打”、“滑下”、“举起”、“吹散”,这些都是非常具体的动作指令。AI接到这些指令后,就会去模拟这些物理动态。
描述动态场景的核心就是:
- 多用动词:用“跑”、“跳”、“飞”、“坠落”、“旋转”这类词来主导你的句子。
- 描述互动:让主体和环境互动起来。比如,“风吹过树林,树叶沙沙作响”就比“有风的树林”要好。
- 按顺序描述:如果一个场景里有连续的动作,就按时间顺序写出来。“一个棒球飞过来,打碎了玻璃,玻璃碎片掉了一地。”这样的描述既清晰又有逻辑。
如何描述镜头运动?像摄影师一样思考。
这是让视频摆脱“PPT感”最关键的一步。在提示词里加入镜头语言,就等于给了AI一台虚拟摄像机,告诉它从哪个角度、用什么方式来拍摄这个场景。
记住,一个提示词通常只对应一个镜头。别想着一句话生成一段包含多个镜头的短片,那会让AI混乱。
下面是一些最常用,而且AI基本都能听懂的镜头语言。
1. 推、拉、摇、移 (基础运镜)
这些是电影拍摄最基础的运镜方式,也是AI视频生成里最常用的。
- 推镜 (Dolly In / Push In):摄像机向主体靠近。作用是聚焦细节,或者营造紧张感。
- 提示词示例:“一个侦探站在证物前,镜头缓慢推向他脸上惊讶的表情 (slow push in on his surprised face)。”
- 拉镜 (Dolly Out / Pull Out):摄像机远离主体。作用是展示更广阔的环境,或者表达疏离感。
- 提示词示例:“一个人孤独地坐在山顶,镜头从他的背影慢慢拉远,展现出连绵的群山 (camera pulls out to reveal the vast mountains)。”
- 摇镜 (Pan):摄像机在原地水平转动(向左或向右)。用来跟随移动的物体,或者展示一个大全景。
- 提示词示例:“一辆跑车在公路上飞驰,镜头从右向左平滑跟随 (smooth pan from right to left, following the car)。”
- 移镜 (Tracking Shot / Trucking Shot):摄像机平行于主体移动。就像你坐在另一辆车上拍旁边的车一样,适合表现追逐或并行的感觉。
- 提示词示例:“两个人沿着海边散步,镜头在他们身旁平行移动 (tracking shot moving alongside the couple)。”
2. 升、降、弧形 (特殊运镜)
这些运镜方式能增加画面的空间感和视觉冲击力。
- 升降镜 (Crane Shot / Boom Shot):摄像机垂直上升或下降。上升通常带来开阔、自由的感觉,下降则可能营造压迫感或揭示感。
- 提示词示例: “镜头从地面的一朵小花开始,向上抬升,越过树梢,最终俯瞰整片森林 (crane shot starts on a flower, rising up over the treetops to an aerial view of the forest)。”
- 环绕镜头 (Orbit Shot / Arc Shot):摄像机围绕主体做弧形运动。非常适合展示一个物体的360度,或者在情感高潮时聚焦角色。
- 提示词示例:“一位芭蕾舞演员在舞台中央旋转,镜头围绕她做360度环绕拍摄 (360-degree orbit shot around the ballerina)。”
3. 视角与景别 (构图指令)
除了运镜,你还要告诉AI从哪个角度拍,拍多大的范围。
- 视角 (Angle):
- 低角度拍摄 (Low-angle shot):从下往上拍,能让主体显得高大、有压迫感。
- 高角度拍摄/鸟瞰视角 (High-angle shot / Bird’s-eye view):从上往下拍,能展示场景全貌,有时也让主体显得渺小。
- 无人机视角 (Drone shot):这个词很直观,AI能很好地理解,通常会生成一种带有开阔感的航拍画面。
- 景别 (Shot Type):
- 特写 (Close-up shot):聚焦于一个细节,比如眼睛或手。
- 中景 (Medium shot):通常拍人物的上半身,适合对话场景。
- 全景 (Wide shot / Long shot):展示主体和其所处的整个环境。
组合使用:一个完整的动态提示词结构
现在,我们把这些元素组合起来。一个好的动态视频提示词,结构可以像这样:
[镜头运动/视角] + [主体] + [具体动作] + [场景细节] + [画面风格/氛围]
我们来看一个实际的例子。
- 想法:一个人在赛博朋克风格的雨夜城市里奔跑。
- 第一版 (静态思维):“一个男人在赛博朋克城市里。” — 这几乎肯定会生成一张静态图或微动图。
- 第二版 (加入动作):“一个男人在雨中的赛博朋克城市街道上奔跑。” — 好一点了,男人会动,但镜头可能是固定的。
- 第三版 (加入镜头运动和细节):“低角度跟踪镜头,一个穿着风衣的男人在雨中湿滑的街道上全力奔跑,身边是闪烁的霓虹灯广告牌,赛博朋克风格,电影感 (low-angle tracking shot, a man in a trench coat sprints down a wet, reflective street in the rain, past glowing neon signs, cyberpunk style, cinematic)。”
这个版本几乎把所有关键信息都给了AI:
* 怎么拍? 低角度跟踪镜头 (low-angle tracking shot)。
* 拍什么? 穿风衣的男人 (a man in a trench coat)。
* 在干嘛? 全力奔跑 (sprints)。
* 环境如何? 雨中湿滑的街道,闪烁的霓虹灯 (wet, reflective street in the rain, glowing neon signs)。
* 什么风格? 赛博朋克,电影感 (cyberpunk style, cinematic)。
用这种结构化的方式去写提示词,你会发现AI给你的反馈会准确得多。多用电影里的专业术语,AI反而能更好地理解你的意图,因为它学习的素材库里充满了这些词汇。 别怕用错,多试几次,很快你就能像个导演一样指挥AI了。





评论前必须登录!
注册