写AI视频的提示词,其实没那么玄乎。很多人把它搞得像念咒语一样,但本质上,你就是在用文字给AI画一张施工图,告诉它你要什么。你描述得越清楚,AI就越能给你想要的画面。反过来,你给一堆模糊的词,AI也只能瞎猜,结果自然好不到哪去。

最基础的公式,记住这个就行:主体 + 动作 + 场景。
主体 (Subject): 你的视频里有什么?是“一个男人”,还是“一只穿着宇航服的猫”?越具体越好。别只说“a man”,可以说“a 30-year-old man with a beard, wearing a red knitted motorcycle helmet”。细节决定了AI的想象空间。
动作 (Action): 主体在干嘛?“走路”、“跑步”还是“在键盘上打字”?动作是视频的核心,它推动了整个故事。 动作也要具体。比如,不说“走路”,可以说“confidently and casually walks down a street”(自信随意地走在街上)。
场景 (Scene): 这事儿发生在哪?“一个房间里”太模糊了。“一个霓虹灯闪烁、地面湿滑反光的东京街道”就好多了。 场景描述包括了背景、前景,甚至天气和时间。
把这三样东西组合起来,就是一个最基本的提示词。比如Sora那个很火的例子:“一个时髦的女人走在东京的街道上,街道上充满了温暖发光的霓虹灯和动画城市标牌。她穿着黑色皮夹克、红色长裙和黑色靴子,挎着一个黑色钱包。她戴着太阳镜,涂着红色口红。她自信而随意地走着。街道潮湿而反光,营造出五颜六色灯光的镜像效果。周围有很多行人在走动。”
你看,这个提示词把主体(时髦女人)、动作(自信地走)和场景(雨后东京街头)描述得非常细致,所以生成的效果就好。
但是,只做到这些还不够,想让视频看起来更像那么回事,而不是一个简单的GIF动图,你就得学着当个“虚拟导演”,在提示词里加入更多电影语言的元素。
像导演一样思考:镜头、光线和风格
真正让AI视频拉开差距的,是那些看起来很专业的东西:镜头运动、布光和整体风格。
1. 镜头语言 (Camera Language)
别让AI自己决定怎么拍,你要主动控制镜头。这能极大地改变视频的观感和叙事效果。
景别 (Shot Framing):
- 特写 (Close-up): 想突出表情或者细节?就用这个。比如“close-up of a child dribbling the ball”(特写一个孩子在运球)。
- 中景 (Medium shot): 通常拍人物腰部以上,适合展示人物的动作和表情。
- 全景 (Wide shot / Long shot): 用来展示整个场景和环境,交代背景。 比如“wide static shot of a city skyline at sunset”(日落时城市天际线的广角静态镜头)。
- 航拍 (Aerial shot / Drone shot): 从空中俯瞰的视角,适合拍大场面,比如“drone shot going down over a coral reef”(无人机镜头下降飞过珊瑚礁)。
镜头角度 (Camera Angle):
- 低角度拍摄 (Low-angle shot): 从下往上拍,能让主体显得更高大、更有压迫感。
- 高角度拍摄 (High-angle shot): 从上往下拍,能让主体显得渺小、脆弱。
- 俯瞰视角 (Overhead view / Top-down perspective): 直接从正上方拍摄。
镜头运动 (Camera Movement): 这是让画面动起来的关键。
- 平移 (Pan): 镜头左右移动。要说清楚方向,比如“camera pans from left to right”(镜头从左向右平移)。
- 推拉 (Zoom): 镜头推进或拉远。比如“camera slowly zooms out from the dog to reveal the porch”(镜头从狗身上缓慢拉远,展现出门廊)。
- 环绕 (Orbit): 围绕主体旋转。比如“orbit around the subject”(围绕主体环绕拍摄)。
- 跟拍 (Tracking shot): 跟随移动的主体拍摄。比如“tracking shot that stays with the hiker as they walk up the trail”(跟拍镜头,始终跟随着徒步者走上小径)。
在Pika Labs这类工具里,你甚至可以用专门的参数来控制镜头,比如 -camera pan right 或者 -camera zoom in。
2. 光线和氛围 (Lighting and Mood)
光是画面的灵魂。不同的光线能营造完全不同的氛围。
- 时间: 直接告诉AI是什么时候,比如“at dawn”(黎明时分)、“golden hour”(黄金时刻)、“at midnight”(午夜)。
- 光线风格: 描述光的质感和效果。“cinematic lighting”(电影感光效)、“soft, mystical lights”(柔和、神秘的光)、“dramatic lighting”(戏剧性光效)。
- 氛围词: 直接用词语定义情绪。“a mood of wonder and curiosity”(惊奇和好奇的氛围)、“a quiet and peaceful mood”(安静祥和的氛围)。 情感词汇能引导AI生成特定感觉的视频。
举个例子,“A neon-lit cyberpunk city at midnight, rain scatters the neon reflections below”(午夜霓虹闪烁的赛博朋克城市,雨水打湿了地面反射着霓虹)。 这个描述就把光线、时间和氛围都交代清楚了。
3. 风格化 (Stylization)
你想让视频是什么风格的?是真人实拍还是动画?是复古还是科幻?
- 电影风格 (Cinematic Style): 这是最常用的。在提示词开头加上 “cinematic” 这个词,通常能得到更有动态感和质感的画面。 还可以更具体,比如“shot on 35mm film, vivid colors”(用35毫米胶片拍摄,色彩鲜艳)。
- 艺术风格 (Art Style): 你可以指定具体的艺术风格,比如“Pixar style”(皮克斯风格)、“anime style”(日漫风格)、“3D render”(3D渲染)。
- 特定导演/游戏风格: 有时候,你甚至可以模仿某个导演或游戏的风格,比如“in the style of Wes Anderson”或者“like Grand Theft Auto video game”。 AI的数据集里有这些信息,它能理解。
一些实用的高级技巧和避坑指南
掌握了基础和进阶要素后,还有一些经验之谈能帮你少走弯路。
保持简洁,一件事说一次。 AI喜欢直接的指令。避免用太复杂或抽象的词语。 一个提示词最好只描述一个清晰的动作或场景。 因为大部分AI视频都很短,塞太多东西进去,AI会混乱。
使用现在时。 描述动作时,用现在时态,比如“a stylish woman walks down a street”,而不是“walked”或“will walk”。
细节要具体,但别瞎编。 AI对物理世界的理解越来越好,但你给的指令如果违背基本物理规律,生成的画面可能会很奇怪。 比如,一个正常的向上抛物线就比一个Z字形飞行的苹果更容易实现。
多试几次 (Iterate)。 不要指望一次就成功。同一个提示词,多生成几次,结果可能完全不同。 这是AI生成内容的特点,不是bug。可以稍微改动几个词,比如换个角度或者光线,看看效果有什么变化。
使用否定提示词 (Negative Prompts)。 如果你发现画面里总出现一些不想要的东西,比如变形的手指、模糊的背景,可以用否定提示词告诉AI要避免什么。在一些工具里,你可以输入“deformed, blurry, ugly, warped”等词来优化画面。
参考别人的作品。 很多AI视频平台都有社区或者案例展示,去看看那些效果好的视频是怎么写的提示词。这是最直接的学习方式。比如Sora官网就公布了很多高质量的提示词,可以直接拿来分析和学习。
总的来说,写提示词的过程,就是一个不断把脑中模糊想法清晰化、结构化的过程。从最核心的“谁在哪干什么”,到“镜头怎么动、光怎么打、什么风格”,你给出的信息越完整、越符合逻辑,AI这个“工具人”就越能给你一个满意的结果。多练习,多尝试,慢慢你就能找到和AI沟通的最佳方式。








评论前必须登录!
注册