AI扩图提示词怎么写，才能让延展部分的内容和风格与原图完美融合？-蜗蜗助手

想让AI扩图（Outpainting）延展出来的部分跟原图一样，关键就在提示词上。AI并不知道你想加什么，你得告诉它。说得越清楚，它做得越好。这事儿没有魔法，就是个沟通问题，你得学会怎么跟AI“说话”。

第一步，先别急着写提示词，先看原图。把原图当成一个已经完成的拼图，你要做的就是描述出这块拼图的所有特征，这样AI才能帮你造出能拼上的新部分。

你需要看这几点：

主体是什么？ 图里最主要的东西是什么？是“一个穿着红色连衣裙的女孩”，还是“一艘在风暴中航行的古老帆船”？把这个核心主体描述清楚。这是提示词的基础。
风格是什么？ 这张图是照片还是画？如果是照片，是哪种感觉？是“80年代胶片相机拍的颗粒感照片”，还是“佳能5D Mark IV相机拍的超清晰商业人像”？如果是画，那是什么风格？是“梵高风格的浓厚油画”，还是“日本吉卜力动画风格的水彩画”？风格词非常关键，它决定了新生成部分的笔触、质感和光影。
光线怎么样？ 光是从哪里来的？是“正午头顶的硬光”，还是“傍晚窗边透进来的柔和侧光”？光线会产生阴影，搞错了方向，新旧部分就会有明显的断层。比如，原图的光从左边来，你让AI生成的部分光从右边来，那肯定看着别扭。
颜色有哪些？ 主要的色调是什么？是“温暖的橙色和黄色”，还是“冰冷的蓝色和灰色”？把主色调写进提示词，能保证AI生成部分的颜色不会跑偏。
构图和场景是什么？ 主体在图的什么位置？背景是什么？是“一个女孩在麦田里”，那扩图的部分就应该是更多的麦田和天空，而不是突然出现一片海洋。你要描述整个场景的氛围，是“宁静的下午”，还是“混乱的战场”？

把这些元素拆解出来，你就拿到了一份“原图说明书”。这份说明书就是你写提示词的骨架。

接下来，我们来写提示词。一个好的扩图提示词，通常由三部分组成：对原图的描述 + 对延展区域的描述 + 风格和技术参数。

假设你有一张图，画面是一个男人站在山顶，只拍了半身。你想把下半身和更多的山脉扩出来。

一个很烂的提示词可能是：“一个男人”。AI收到这个指令，可能会随便给你画一个男人，风格、光线、环境都跟原图对不上。

一个稍微好点的提示词：“一个穿着黑色夹克的男人站在山顶上，扩充他的腿和脚，以及更多的山”。这个好一些，但还不够。AI可能会画出一条跟上半身夹克风格不符的裤子，山的风格也可能突变。

一个优秀的提示词应该是这样的：

“A man wearing a black leather jacket, standing on a rocky mountain peak. Extend downwards to show his dark blue jeans and brown hiking boots. The surrounding area should be more of the same rocky terrain under a cloudy sky. Hyperrealistic photo, shot on a Sony A7III with a 35mm lens, natural afternoon light coming from the left, cinematic style, sharp focus.”

我们来拆解一下这个提示词为什么好：

对原图的描述： “A man wearing a black leather jacket, standing on a rocky mountain peak.” (一个穿着黑色皮夹克的男人，站在岩石山顶上。) 这是告诉AI，我们已经有什么了。
对延展区域的描述： “Extend downwards to show his dark blue jeans and brown hiking boots. The surrounding area should be more of the same rocky terrain under a cloudy sky.” (向下延展，展示他的深蓝色牛仔裤和棕色登山靴。周围区域应该是更多同样风格的岩石地形和多云的天空。) 这里你明确告诉AI，新内容是什么，而且强调了“same rocky terrain”（同样风格的岩石地形），这就是在要求保持一致性。
风格和技术参数： “Hyperrealistic photo, shot on a Sony A7III with a 35mm lens, natural afternoon light coming from the left, cinematic style, sharp focus.” (超写实照片，用索尼A7III相机和35mm镜头拍摄，自然下午光从左侧照射，电影风格，锐利对焦。) 这部分是灵魂。你不仅告诉了AI这是“照片”，还具体到了相机型号和镜头，这会影响画面的质感和景深。你指明了光线方向“coming from the left”（从左侧来），确保了光影统一。最后加上“cinematic style”（电影风格）和“sharp focus”（锐利对焦）来锁定整体感觉。

这就是一个完整的逻辑。你先帮AI理解了原图，然后告诉它新内容是什么，最后用风格和技术参数把所有东西统一起来。

在具体操作中，不同的工具有不同的侧重点。

如果你用的是Midjourney，它的 /remix 模式在扩图时非常有用。开启这个模式后，当你点击扩图按钮（Pan），它会弹出一个对话框，里面已经填好了原图的提示词。这时候你就可以在原有提示词的基础上，添加对延展部分的描述。比如，原提示词是：“A cute cat, anime style --ar 1:1”，你想往右边扩图，可以把提示词改成：“A cute cat sitting on a windowsill, anime style --ar 3:2”。你加入了新的场景元素“sitting on a windowsill”（坐在窗台上），并且调整了长宽比，引导AI去填充新的空间。

如果你用的是Photoshop的生成式填充（Generative Fill），操作更直接。你用选框工具选中要填充的空白区域，然后在弹出的提示词框里输入指令。Photoshop的AI很擅长理解上下文，所以提示词可以更口语化。比如，你框出一片天空，直接输入“cloudy sky at sunset”（日落时的多云天空），它就能很好地结合原图的光线和颜色去生成。但如果你想控制得更精细，同样需要遵循上面的原则，在提示词里加入风格描述，比如“oil painting of a cloudy sky at sunset”（日落时多云天空的油画），结果会更贴近绘画风格。

还有一个技巧是使用负面提示词（Negative Prompts）。这是告诉AI不要画什么。比如，你在扩充一张人像照片时，不希望新生成的手指是畸形的，就可以在负面提示词里加入“deformed fingers, extra limbs, ugly”（畸形手指，多余的肢体，丑陋）。或者你不希望画面变得模糊，可以加入“blurry, out of focus”（模糊，失焦）。这能有效避免一些常见的AI绘图错误，让画面更干净。

另外，权重也很重要。有些工具允许你调整提示词里某个词的权重。比如在提示词里写 (blue sky:1.3)，意思就是让“blue sky”这个元素的重要性增加30%。当你发现AI生成的某个部分风格不对时，可以试着增加原图核心风格词的权重，比如 (van gogh style:1.5)，来强制AI更严格地遵守这个风格。

总结一下具体的操作步骤：

分析原图：把主体、风格、光线、颜色、构图这几个要素用关键词记下来。
构建基础提示词：把第一步的关键词组合成一个完整的句子，用来描述原图。
添加延展描述：明确说明你要在哪个方向、添加什么具体内容。多用“extend”、“add more of the same”这类词来要求一致性。
加入风格和技术参数：这是保证融合度的关键。写上相机型号、镜头、光线方向、艺术风格等具体参数。
使用负面提示词：排除掉你不想要的东西，避免画面出错。
迭代和调整：第一次生成的结果不完美很正常。你需要根据生成的结果，回头去修改你的提示词。是风格不对？那就加强风格词。是内容不对？那就把内容描述得再具体一点。

这整个过程不像按一个按钮那么简单，它更像是在训练一个学徒。你需要耐心，不断地给它清晰的指令，它才能最终做出你想要的东西。你给AI的信息越是模糊、通用，它产出的结果就越随机。反之，你给它的信息越是精确、具体，它就越能产出与原图完美融合的扩图部分。

AI扩图提示词怎么写，才能让延展部分的内容和风格与原图完美融合？

相关推荐

评论抢沙发

评论前必须登录！

热门文章

你的AI灵感库与创作引擎

给想象力一个支点，让蜗蜗助手撬动AI的无限可能。

切换注册登录

切换登录注册