想让AI画出连-贯的故事分镜,最大的难题是角色和场景的统一性。你肯定遇到过这种情况:第一个镜头里的主角还是黑发,下一个镜头就变成金发了,背景里的桌子也莫名其妙换了位置。这事儿不赖你,AI生成图片本质上是一次次的独立创作,它没有“记忆”,不会自动记得上一张画了什么。解决这个问题的核心思路,就是你得当导演,把AI当成一个听话但没记性的画师,你必须在每一条指令(Prompt)里,把所有关键信息都重复一遍,而且要说得极其具体。
第一步:给你的主角创建一份“角色卡”
这是最关键的一步,也是保证角色一致性的基础。在动笔写第一个分镜提示词之前,先单独创建一个文本,把主角的所有核心特征都写下来,越详细越好。这份东西就是角色的“身份档案”或“角色卡”。
这份角色卡应该包含这些信息:
- 五官和面部特征:比如“杏仁状的蓝色眼睛”、“高挺的鼻梁”、“左眉尾有一颗小痣”、“小麦色皮肤,有少量雀斑”。 不要只说“好看的女孩”,这种模糊的词AI无法理解。
- 发型和发色:要具体到“深棕色及肩卷发,齐刘海”。
- 身材体型:例如“身材修长,肌肉线条明显”或者“微胖,圆脸”。
- 固定服装:给角色一套在故事里不会轻易更换的标志性服装。 比如,“一件带兜帽的灰色卫衣,胸前有一个小小的白色星球图案,搭配深蓝色牛仔裤和白色运动鞋”。
写好这份角色卡之后,它就是你接下来每一个提示词里雷打不动的一部分。每次生成新分镜,你都要把这段描述复制粘贴进去。 这样做虽然麻烦,但能最大限度地提醒AI:“嘿,我要画的是这个人,记住这些特征。”
第二步:像导演一样思考,用镜头语言写提示词
别把提示词当成许愿,要把它当成给摄影师和灯光师的工作指令。你需要明确告诉AI,这一帧画面要怎么“拍”。
一个专业的分镜提示词,结构通常是这样的:
[镜头景别] + [主体与动作] + [场景环境] + [光线氛围] + [画风指令]
我们来拆解一下:
-
镜头景别 (Shot Type):这是叙事的开始。你想让观众看到什么?是宏大的场景还是人物的细微表情?必须明确。
establishing shot(建构镜头/远景):用来展示环境,交代故事发生的地点。wide shot(全景):能看到角色的全身和部分环境。medium shot(中景):通常是角色的半身像,聚焦于角色的上半身动作。close-up(特写):聚焦于角色的脸部,用来表现情绪。extreme close-up(大特写):可能只拍眼睛或手部,用来强调某个细节。over-the-shoulder shot(过肩镜头):从一个角色的肩膀后方拍向另一个角色,常用于对话场景。
-
主体与动作 (Subject and Action):这里就要用上你第一步创建的“角色卡”了。把角色卡的描述整个复制过来,然后加上他/她正在做什么。 动作要描述得清晰、直接。不要写“他看起来很伤心”,要写“他低着头,双手捂着脸,肩膀在颤抖”。
-
场景环境 (Setting):和角色卡一样,场景也需要一份“设定卡”。 比如故事发生在一个“凌乱的侦探办公室”,那你就要描述清楚:“木制办公桌上堆满了文件,墙上挂着一块软木板,上面钉着案件线索,百叶窗半拉着,透进几缕光线”。在后续的镜头里,只要还在这间办公室,这段描述就要跟着复制。
-
光线氛围 (Lighting and Atmosphere):光是情绪的塑造者。 “清晨柔和的窗边光”、“下午刺眼的阳光”、“夜晚霓虹灯闪烁的街道”、“阴暗的、充满戏剧性阴影的房间”。 保持光线风格的统一,故事的调性才不会跑偏。
-
画风指令 (Style Specification):你希望这个故事看起来像什么?“吉卜力动画风格”、“黑白漫画素描风格”、“电影感剧照”、“赛博朋克艺术风格”。这个指令也要在所有分镜中保持一致,以确保视觉风格的连贯。
第三步:用技术手段辅助,锁定一致性
除了优化文字,一些AI绘画工具也提供了技术参数来帮助我们。
- Seed值 (种子值):Seed值可以理解为AI生成这张图片时所依据的初始“随机数”。 如果你在两次生成时使用相同的Seed值和几乎相同的提示词,AI会倾向于生成非常相似的画面。 这对于微调角色的动作或表情,同时保持人物和背景基本不变,特别有用。你可以先生成一张满意的基础图,记下它的Seed值,然后在下一个提示词里只改动动作描述,并附上相同的Seed值。
- 角色参考功能 (Character Reference):一些主流工具,比如Midjourney,现在有了专门的“角色参考”功能(
--cref)。 你可以先生成一张最标准、最符合你要求的角色正面图,然后把这张图的链接作为参考喂给AI。 在后续生成中,AI会努力模仿这张参考图中的角色特征,这比单纯靠文字描述要精准得多。
实战演练:一个简单的三镜头故事
假设我们的故事是:一个叫“艾拉”的女孩在雨夜的城市里找到了她走失的小猫。
首先,创建角色卡和场景卡:
- 艾拉角色卡:
A young woman named Elara, with shoulder-length curly red hair, freckles on her nose, wearing a green varsity jacket with a yellow stripe, blue jeans, and white sneakers. - 场景卡:
A narrow alleyway in a city at night, ground is wet from rain, neon signs from the main street cast a colorful glow, puddles reflecting the lights.
现在开始写分镜提示词:
-
分镜1:艾拉焦急地寻找
Medium shot of [艾拉角色卡], she is looking around anxiously, biting her lip. She is in [场景卡]. Cinematic lighting, style of a modern animated film. -
分镜2:艾拉听到声音,有所发现
Close-up on the face of [艾拉角色卡], her expression changes from anxiety to hope, her eyes wide. She is in [场景卡]. The lighting focuses on her face, background is slightly blurred. Cinematic lighting, style of a modern animated film. --seed [分镜1的seed值]
注意:这里我们用了特写来放大情绪变化,并且尝试使用上一张图的Seed值来稳定画面。 -
分镜3:找到小猫
Wide shot of [艾拉角色卡], she is crouching down, reaching her hand out gently to a small, scared black kitten hiding behind a trash can. She is in [场景卡]. A warm light seems to emanate from her, contrasting with the cold alley. Cinematic lighting, style of a modern animated film.
注意:这里换成了全景,以交代人与猫的位置关系,同时通过光线变化来表达故事的转折。
通过这种方式,我们把每一个镜头的控制权都牢牢抓在自己手里。AI不再是随心所欲的画家,而是执行你精确指令的工具。这个过程确实需要耐心和练习,但一旦你掌握了像导演一样思考的方法,你就能让AI为你创造出真正连贯、有故事感的画面。



评论前必须登录!
注册