写AI视频指令,其实就跟学着跟一个很聪明但没啥生活经验的实习生沟通差不多。你得说得特别直白,一个指令一个动作,它才能准确理解你的想法,给你生成想要的画面。别指望它能猜到你心里想什么,你给的指令越模糊,出来的结果就越“惊吓”。
先从骨架开始:主体 + 动作 + 场景
别一上来就想搞个大片,先从最基本的三个元素开始,把骨架搭起来。这就像画画,先画轮廓再填细节。
- 主体 (Subject): 画面里最主要的东西是什么?是人还是物? 尽量具体。不要只说“一个男人”,而是“一个穿着旧款棕色皮夹克的白发老人”。 细节越多,AI抓取到的特征就越准。
- 动作 (Action): 主体在干什么? 动作要简单直接。 比如,“坐着看报纸”,就比“在思考人生”要好得多。AI能理解具体的、能看到的动作,但理解不了抽象的概念。 避免在一个短镜头里塞进太多动作,比如“男人站起来,走到窗边,然后喝了口咖啡”,AI很容易搞混,最后可能只执行了第一个或者最后一个动作,甚至生成一个四不像的画面。
- 场景 (Scene): 这事儿发生在哪? 同样,具体点。“一个光线昏暗的图书馆”,就比“一个房间里”要明确得多。 场景描述可以包括前景、背景,甚至是天气。比如,“夜晚的东京街头,路面湿滑,反射着五颜六色的霓虹灯”。
把这三样东西拼起来,就是一个最基础的指令了。比如:“一个穿着旧款棕色皮夹克的白发老人,坐在光线昏暗的图书馆里,慢慢地翻着一本书。” 这条指令清晰、具体,AI处理起来就没那么费劲。
丰富画面:风格、镜头和光线是关键
有了骨架,现在可以加点肉,让画面活起来。这时候就要用到一些摄影和美术的词汇了。别担心,不需要你成为专业导演,只要懂几个基本术语,就能让视频质量好几个档次。
1. 风格 (Style): 你想要什么样的整体感觉? 是像动画片还是真人电影? 直接告诉AI。你可以用“皮克斯动画风格”、“宫崎骏动画风格”或者“80年代恐怖电影风格”。 还可以更具体,比如“赛博朋克”、“蒸汽朋克”或者“水墨画风格”。风格词能快速给视频定下调子。
2. 镜头 (Camera): 这是决定画面观感的重头戏。你想让观众怎么看这个场景?
- 景别: “远景镜头 (Wide shot)”用来展示宏大场景。 “中景镜头 (Medium shot)”大概拍到人物腰部以上,适合展示人物表情和上半身动作。 “特写镜头 (Close-up)”用来放大细节,比如眼睛、手上的戒指等等。
- 角度: “低角度拍摄 (Low-angle shot)”会让主体看起来更高大、更有压迫感。 “俯视镜头 (Overhead view)”就是从上往下拍,有种上帝视角的感觉。
- 运镜: 这是让画面动起来的关键。“向前推镜 (Dolly in)”或者“拉近 (Zoom in)”可以把焦点集中到某个物体上。 “平移镜头 (Pan left/right)”就是镜头左右移动,适合展示开阔的风景。 “环绕镜头 (Orbit around)”可以360度展示主体。 但是切记,复杂的镜头运动AI很难处理好,开始阶段最好用简单的静态或者单一方向的运镜。
3. 光线 (Lighting): 光线决定了画面的情绪和氛围。 “清晨柔和的阳光”给人的感觉就很温暖、有希望。“午后刺眼的阳光”可能就代表着炎热和烦躁。“霓虹灯闪烁”则充满了都市感和迷幻色彩。 你甚至可以用更专业的词,比如“伦勃朗光”、“边缘光 (Rim light)”来营造戏剧性效果。
我们把这些元素加到之前的指令里,它就变成了:“电影感,低角度拍摄。一个穿着旧款棕色皮夹克的白发老人,坐在光线昏暗的图书馆里,只有一盏台灯照亮他,他慢慢地翻着一本书,书页在灯光下微微泛黄。” 你看,画面感是不是一下子就出来了?
进阶技巧:让AI更懂你的“潜台词”
当你掌握了基础指令的写法后,可以尝试一些更高级的玩法,让AI的输出更可控。
1. 用图生视频 (Image-to-Video): 这是个特别好用的功能。很多AI视频工具都支持你先上传一张参考图,然后再用指令让这张图动起来。 这样做的好处是,你可以牢牢控制画面的基本构图、色彩和人物形象,AI只需要在这个基础上添加动态效果,不容易跑偏。 比如你先用AI绘画工具生成一个你满意的角色形象,再把它传给视频工具,指令就可以写得更简单,比如“嘴巴在说话,眼神悲伤,窗外的雨在下”。
2. 负面指令 (Negative Prompts): 有时候,你不想要什么和想要什么同样重要。 负面指令就是告诉AI要避开哪些元素。 比如,你希望画面干净,就可以加上“避免模糊 (blurry), 避免变形 (deformed)”。 如果不想要动画感,就加上“避免卡通 (cartoon), 避免动漫 (anime)”。这能有效过滤掉一些奇怪的、不符合你预期的结果。
3. 结构化指令: 当指令变得很长的时候,用简单的逗号隔开会让AI困惑。可以尝试用结构化的方式来写,把不同类别的描述分开。比如:
* 主体: 一只黑猫。
* 动作: 在下雨的窗台上行走,姿态优雅。
* 场景: 舒适的房间内,窗外是夜晚的城市。
* 风格: 动漫风格,吉卜力工作室的感觉。
* 镜头: 侧面跟踪镜头,焦距很浅,焦点在猫身上。
* 光线: 房间内光线温暖,窗外的城市灯光模糊成一片。
这样分点列出来,逻辑清晰,AI也更容易按你的想法一步步执行。
必须避开的几个坑
最后,说几个我踩过的坑,能帮你省下不少时间和计算资源。
- 别太贪心: 一个镜头里只做一件事。 AI处理不了复杂的叙事和场景转换。 你想让一个人从客厅走到厨房,最好分成两个镜头来生成。
- 语言要直接: 避免用比喻或者太文艺的说法。 “他的眼神像深邃的宇宙”这种描述,AI是无法理解的。直接说“深蓝色的眼睛,眼神专注”效果会好得多。
- 保持一致性: 如果你想生成一系列风格统一的短片,最好把风格、色彩、镜头相关的关键词固定下来,只改变主体和动作的描述。 这样能保证你的系列视频看起来是“一套”的,而不是东拼西凑的。
- 多试几次: 同一个指令,每次生成的结果都可能不一样。 这是AI的“创造性”,也是它的不稳定性。 如果第一次效果不好,别急着大幅修改指令,可以先尝试重新生成几次。有时候,好结果就是多点几下的事。








评论前必须登录!
注册