分镜提示词怎么写才能让AI理解并生成具有连贯性的故事画面？-蜗蜗助手

想让AI画出连-贯的故事分镜，最大的难题是角色和场景的统一性。你肯定遇到过这种情况：第一个镜头里的主角还是黑发，下一个镜头就变成金发了，背景里的桌子也莫名其妙换了位置。这事儿不赖你，AI生成图片本质上是一次次的独立创作，它没有“记忆”，不会自动记得上一张画了什么。解决这个问题的核心思路，就是你得当导演，把AI当成一个听话但没记性的画师，你必须在每一条指令（Prompt）里，把所有关键信息都重复一遍，而且要说得极其具体。

第一步：给你的主角创建一份“角色卡”

这是最关键的一步，也是保证角色一致性的基础。在动笔写第一个分镜提示词之前，先单独创建一个文本，把主角的所有核心特征都写下来，越详细越好。这份东西就是角色的“身份档案”或“角色卡”。

这份角色卡应该包含这些信息：

五官和面部特征：比如“杏仁状的蓝色眼睛”、“高挺的鼻梁”、“左眉尾有一颗小痣”、“小麦色皮肤，有少量雀斑”。不要只说“好看的女孩”，这种模糊的词AI无法理解。
发型和发色：要具体到“深棕色及肩卷发，齐刘海”。
身材体型：例如“身材修长，肌肉线条明显”或者“微胖，圆脸”。
固定服装：给角色一套在故事里不会轻易更换的标志性服装。比如，“一件带兜帽的灰色卫衣，胸前有一个小小的白色星球图案，搭配深蓝色牛仔裤和白色运动鞋”。

写好这份角色卡之后，它就是你接下来每一个提示词里雷打不动的一部分。每次生成新分镜，你都要把这段描述复制粘贴进去。这样做虽然麻烦，但能最大限度地提醒AI：“嘿，我要画的是这个人，记住这些特征。”

第二步：像导演一样思考，用镜头语言写提示词

别把提示词当成许愿，要把它当成给摄影师和灯光师的工作指令。你需要明确告诉AI，这一帧画面要怎么“拍”。

一个专业的分镜提示词，结构通常是这样的：

[镜头景别] + [主体与动作] + [场景环境] + [光线氛围] + [画风指令]

我们来拆解一下：

镜头景别 (Shot Type)：这是叙事的开始。你想让观众看到什么？是宏大的场景还是人物的细微表情？必须明确。
- establishing shot (建构镜头/远景)：用来展示环境，交代故事发生的地点。
- wide shot (全景)：能看到角色的全身和部分环境。
- medium shot (中景)：通常是角色的半身像，聚焦于角色的上半身动作。
- close-up (特写)：聚焦于角色的脸部，用来表现情绪。
- extreme close-up (大特写)：可能只拍眼睛或手部，用来强调某个细节。
- over-the-shoulder shot (过肩镜头)：从一个角色的肩膀后方拍向另一个角色，常用于对话场景。
主体与动作 (Subject and Action)：这里就要用上你第一步创建的“角色卡”了。把角色卡的描述整个复制过来，然后加上他/她正在做什么。动作要描述得清晰、直接。不要写“他看起来很伤心”，要写“他低着头，双手捂着脸，肩膀在颤抖”。
场景环境 (Setting)：和角色卡一样，场景也需要一份“设定卡”。比如故事发生在一个“凌乱的侦探办公室”，那你就要描述清楚：“木制办公桌上堆满了文件，墙上挂着一块软木板，上面钉着案件线索，百叶窗半拉着，透进几缕光线”。在后续的镜头里，只要还在这间办公室，这段描述就要跟着复制。
光线氛围 (Lighting and Atmosphere)：光是情绪的塑造者。 “清晨柔和的窗边光”、“下午刺眼的阳光”、“夜晚霓虹灯闪烁的街道”、“阴暗的、充满戏剧性阴影的房间”。保持光线风格的统一，故事的调性才不会跑偏。
画风指令 (Style Specification)：你希望这个故事看起来像什么？“吉卜力动画风格”、“黑白漫画素描风格”、“电影感剧照”、“赛博朋克艺术风格”。这个指令也要在所有分镜中保持一致，以确保视觉风格的连贯。

第三步：用技术手段辅助，锁定一致性

除了优化文字，一些AI绘画工具也提供了技术参数来帮助我们。

Seed值 (种子值)：Seed值可以理解为AI生成这张图片时所依据的初始“随机数”。如果你在两次生成时使用相同的Seed值和几乎相同的提示词，AI会倾向于生成非常相似的画面。这对于微调角色的动作或表情，同时保持人物和背景基本不变，特别有用。你可以先生成一张满意的基础图，记下它的Seed值，然后在下一个提示词里只改动动作描述，并附上相同的Seed值。
角色参考功能 (Character Reference)：一些主流工具，比如Midjourney，现在有了专门的“角色参考”功能（--cref）。你可以先生成一张最标准、最符合你要求的角色正面图，然后把这张图的链接作为参考喂给AI。在后续生成中，AI会努力模仿这张参考图中的角色特征，这比单纯靠文字描述要精准得多。

实战演练：一个简单的三镜头故事

假设我们的故事是：一个叫“艾拉”的女孩在雨夜的城市里找到了她走失的小猫。

首先，创建角色卡和场景卡：

艾拉角色卡：A young woman named Elara, with shoulder-length curly red hair, freckles on her nose, wearing a green varsity jacket with a yellow stripe, blue jeans, and white sneakers.
场景卡：A narrow alleyway in a city at night, ground is wet from rain, neon signs from the main street cast a colorful glow, puddles reflecting the lights.

现在开始写分镜提示词：

分镜1：艾拉焦急地寻找
Medium shot of [艾拉角色卡], she is looking around anxiously, biting her lip. She is in [场景卡]. Cinematic lighting, style of a modern animated film.
分镜2：艾拉听到声音，有所发现
Close-up on the face of [艾拉角色卡], her expression changes from anxiety to hope, her eyes wide. She is in [场景卡]. The lighting focuses on her face, background is slightly blurred. Cinematic lighting, style of a modern animated film. --seed [分镜1的seed值]
注意：这里我们用了特写来放大情绪变化，并且尝试使用上一张图的Seed值来稳定画面。
分镜3：找到小猫
Wide shot of [艾拉角色卡], she is crouching down, reaching her hand out gently to a small, scared black kitten hiding behind a trash can. She is in [场景卡]. A warm light seems to emanate from her, contrasting with the cold alley. Cinematic lighting, style of a modern animated film.
注意：这里换成了全景，以交代人与猫的位置关系，同时通过光线变化来表达故事的转折。

通过这种方式，我们把每一个镜头的控制权都牢牢抓在自己手里。AI不再是随心所欲的画家，而是执行你精确指令的工具。这个过程确实需要耐心和练习，但一旦你掌握了像导演一样思考的方法，你就能让AI为你创造出真正连贯、有故事感的画面。

分镜提示词怎么写才能让AI理解并生成具有连贯性的故事画面？

相关推荐

评论抢沙发

评论前必须登录！

热门文章

你的AI灵感库与创作引擎

给想象力一个支点，让蜗蜗助手撬动AI的无限可能。

切换注册登录

切换登录注册