想让AI给你生成一段视频,关键就在于你怎么跟它“说话”,也就是你写的提示词。这事儿没那么玄乎,也不需要你懂什么代码。说白了,就是把脑子里的画面,用AI能听懂的语言描述出来。这就像你跟一个摄影师沟通,你说得越清楚,他拍出来的东西就越接近你想要的。

一、先拆解一个好提示词的基本公式
大部分AI视频工具吃的是一套相似的逻辑。一个好的提示词,通常都包含下面几个部分。你可以把这当成一个公式:主体 + 动作 + 场景 + 风格和镜头。
- 主体 (Subject): 你的视频里有什么?是“一个穿着盔甲的宇航员”,还是“一只橘猫”?主体要说清楚,细节越多越好。比如,不是“一个人”,而是“一个留着胡子、戴着眼镜的中年男人”。
- 动作 (Action): 主体在干什么?是“在雨中奔跑”,还是“安静地喝着咖啡”?动作是视频的核心,它决定了视频会不会无聊。 动作要具体,比如“宇航员正在月球表面插上一面旗帜”。
- 场景 (Scene): 这事儿发生在哪? 是“一个霓虹灯闪烁的赛博朋克城市街道”,还是“一个宁静的日式庭院”?场景提供了背景和氛围。 细节很重要,比如庭院里可以有“飘落的樱花”和“一个石灯笼”。
- 风格和镜头 (Style & Camera): 这是让视频看起来更“专业”的关键。你想让视频是“电影感”的,“动漫风格”的,还是“80年代复古DV”的感觉? 镜头怎么动?是“从低角度仰拍”,还是“无人机航拍”?
把这些要素拼起来,就是一个基础但有效的提示词。比如:“一个留着胡子、戴着眼镜的中年男人(主体),正在一个日式庭院里(场景),安静地喝着咖啡(动作),镜头缓慢向前推进,特写他脸上的表情,电影感,柔和的晨光(风格和镜头)。”
你看,这个描述就很具体,AI拿到 такой指令,脑子里就有画面了。
二、一步一步教你怎么写
现在我们把上面的公式实际操作一下。假设我想生成一个“小女孩在森林里遇到一只鹿”的视频。
第一步:确定核心内容(主体和动作)
最核心的,就是“一个小女孩”和“一只鹿”。她们在干什么?就设定成“小女孩小心翼翼地向小鹿伸出手,小鹿好奇地看着她”。
- 初步提示词:
一个小女孩和一只鹿。(太模糊了,AI不知道她们在干嘛) - 改进后:
一个小女孩向一只鹿伸出手。(好一点了,但还是很干瘪) - 再改进:
一个穿着红色斗篷的小女孩,小心翼翼地向一只小鹿伸出手,小鹿歪着头好奇地看着她。(现在画面感出来了)
第二步:搭建场景,营造氛围
这事儿发生在哪里?森林里。什么样的森林?我们可以加点细节。
- 加上场景:
在一个阳光穿透树叶的森林里,一个穿着红色斗篷的小女孩,小心翼翼地向一只小鹿伸出手,小鹿歪着头好奇地看着她。
氛围也很重要。你想要什么样的感觉?神秘的?温暖的?我们可以通过描述光线来控制氛围。
- 加上氛围:
在一个阳光穿透树叶、充满金色光斑的魔法森林里,空气中漂浮着发光的尘埃。一个穿着红色斗篷的小女孩,小心翼翼地向一只小鹿伸出手,小鹿歪着头好奇地看着她。整体氛围温暖、梦幻。
第三步:像导演一样思考镜头
现在,想象你就是导演,你要怎么拍这个画面? 直接怼着拍?还是用一些镜头语言让它更有感觉?
我们可以用一些专业的术语,很多AI模型都能看懂。
- 景别 (Shot Type): 是“特写 (close-up)”小女孩的眼睛,还是“广角镜头 (wide shot)”拍下整个森林?
- 机位/角度 (Camera Angle): 是“低角度 (low-angle shot)”显得小鹿更高大,还是“俯视镜头 (high-angle shot)”?
- 镜头运动 (Camera Movement): 镜头是固定的 (static shot),还是“缓慢平移 (slow pan)”?或者是“跟拍 (tracking shot)”,跟着小女孩移动?
我们来加一个镜头描述。
- 最终版本:
一个穿着红色斗篷的小女孩,在一个阳光穿透树叶、充满金色光斑的魔法森林里,空气中漂浮着发光的尘埃。她小心翼翼地向一只小鹿伸出手,小鹿歪着头好奇地看着她。中景镜头 (medium shot),摄影机从侧面缓慢向右平移 (camera slowly pans right),浅景深 (shallow depth of field),焦外是模糊的树木。电影感,色彩鲜艳,风格类似宫崎骏动画。
这个提示词就非常具体了。它告诉了AI要拍什么、在哪拍、怎么拍,以及最后要什么样的感觉。
三、一些让效果更好的个人经验
1. 用词要直接,别绕弯子。
AI不是人,它理解不了比喻或者过于文学化的描述。 你想让画面是“悲伤的”,可以直接用“冷色调、下着小雨、人物表情悲伤”这样的描述,而不是写“空气中弥漫着忧伤的气息”。
2. 细节决定成败,但不是越多越好。
细节很重要,但如果你的提示词里充满了互相矛盾的细节,AI会“精神错乱”。 比如,你又要“阳光明媚”,又要“阴森恐怖”,这会让AI不知道该听谁的。一次只专注一个核心的氛围和场景。
3. 把复杂动作拆开。
现在的AI一次处理一个复杂长镜头还是有点吃力。如果你想让一个人“站起来,走到窗边,然后拉开窗帘”,最好把这个过程分成几个短视频来生成,或者简化成一个核心动作。 否则,结果可能会很奇怪。
4. 尝试使用负面提示词 (Negative Prompts)。
有些工具(比如Pika Labs)允许你使用负面提示词,也就是告诉AI“不想要什么”。 比如你生成的视频里人脸总是变形,就可以在负面提示词里写上 deformed faces, ugly, blurry (变形的脸、丑陋、模糊)。这能有效提高视频质量。
5. 多试几次,不断调整。
别指望一次就能生成完美的结果。AI生成有随机性,同一个提示词,每次出来的结果都可能不一样。 这很正常。你需要做的就是根据生成的结果,回头去修改你的提示词,这是一个不断调整和优化的过程。 可能第一次光线不对,第二次动作有点僵硬,那就针对性地去改描述光线和动作的词。
6. 参考别人的作品和提示词。
很多AI视频平台都有社区,用户会分享他们的作品和提示词。 这是一个很好的学习资源。看看那些效果好的视频是怎么描述的,把好的词汇和句式学过来,用到你自己的创作里。
总的来说,生成AI视频的过程,更像是一种跟机器协作的艺术创作。你的提示词就是剧本和分镜,你给的指令越清晰,AI这个“演员”兼“摄影师”的表现就越好。这需要练习,但一旦你掌握了这种“沟通方式”,就能把脑子里的想法变成真实的画面了。








评论前必须登录!
注册