蜗蜗助手
让 AI 更懂你

AI扩图提示词怎么写,才能让延展部分的内容和风格与原图完美融合?

想让AI扩图(Outpainting)延展出来的部分跟原图一样,关键就在提示词上。AI并不知道你想加什么,你得告诉它。说得越清楚,它做得越好。这事儿没有魔法,就是个沟通问题,你得学会怎么跟AI“说话”。

第一步,先别急着写提示词,先看原图。把原图当成一个已经完成的拼图,你要做的就是描述出这块拼图的所有特征,这样AI才能帮你造出能拼上的新部分。

你需要看这几点:

  1. 主体是什么? 图里最主要的东西是什么?是“一个穿着红色连衣裙的女孩”,还是“一艘在风暴中航行的古老帆船”?把这个核心主体描述清楚。这是提示词的基础。
  2. 风格是什么? 这张图是照片还是画?如果是照片,是哪种感觉?是“80年代胶片相机拍的颗粒感照片”,还是“佳能5D Mark IV相机拍的超清晰商业人像”?如果是画,那是什么风格?是“梵高风格的浓厚油画”,还是“日本吉卜力动画风格的水彩画”?风格词非常关键,它决定了新生成部分的笔触、质感和光影。
  3. 光线怎么样? 光是从哪里来的?是“正午头顶的硬光”,还是“傍晚窗边透进来的柔和侧光”?光线会产生阴影,搞错了方向,新旧部分就会有明显的断层。比如,原图的光从左边来,你让AI生成的部分光从右边来,那肯定看着别扭。
  4. 颜色有哪些? 主要的色调是什么?是“温暖的橙色和黄色”,还是“冰冷的蓝色和灰色”?把主色调写进提示词,能保证AI生成部分的颜色不会跑偏。
  5. 构图和场景是什么? 主体在图的什么位置?背景是什么?是“一个女孩在麦田里”,那扩图的部分就应该是更多的麦田和天空,而不是突然出现一片海洋。你要描述整个场景的氛围,是“宁静的下午”,还是“混乱的战场”?

把这些元素拆解出来,你就拿到了一份“原图说明书”。这份说明书就是你写提示词的骨架。

接下来,我们来写提示词。一个好的扩图提示词,通常由三部分组成:对原图的描述 + 对延展区域的描述 + 风格和技术参数。

假设你有一张图,画面是一个男人站在山顶,只拍了半身。你想把下半身和更多的山脉扩出来。

一个很烂的提示词可能是:“一个男人”。AI收到这个指令,可能会随便给你画一个男人,风格、光线、环境都跟原图对不上。

一个稍微好点的提示词:“一个穿着黑色夹克的男人站在山顶上,扩充他的腿和脚,以及更多的山”。这个好一些,但还不够。AI可能会画出一条跟上半身夹克风格不符的裤子,山的风格也可能突变。

一个优秀的提示词应该是这样的:

A man wearing a black leather jacket, standing on a rocky mountain peak. Extend downwards to show his dark blue jeans and brown hiking boots. The surrounding area should be more of the same rocky terrain under a cloudy sky. Hyperrealistic photo, shot on a Sony A7III with a 35mm lens, natural afternoon light coming from the left, cinematic style, sharp focus.

我们来拆解一下这个提示词为什么好:

  • 对原图的描述: “A man wearing a black leather jacket, standing on a rocky mountain peak.” (一个穿着黑色皮夹克的男人,站在岩石山顶上。) 这是告诉AI,我们已经有什么了。
  • 对延展区域的描述: “Extend downwards to show his dark blue jeans and brown hiking boots. The surrounding area should be more of the same rocky terrain under a cloudy sky.” (向下延展,展示他的深蓝色牛仔裤和棕色登山靴。周围区域应该是更多同样风格的岩石地形和多云的天空。) 这里你明确告诉AI,新内容是什么,而且强调了“same rocky terrain”(同样风格的岩石地形),这就是在要求保持一致性。
  • 风格和技术参数: “Hyperrealistic photo, shot on a Sony A7III with a 35mm lens, natural afternoon light coming from the left, cinematic style, sharp focus.” (超写实照片,用索尼A7III相机和35mm镜头拍摄,自然下午光从左侧照射,电影风格,锐利对焦。) 这部分是灵魂。你不仅告诉了AI这是“照片”,还具体到了相机型号和镜头,这会影响画面的质感和景深。你指明了光线方向“coming from the left”(从左侧来),确保了光影统一。最后加上“cinematic style”(电影风格)和“sharp focus”(锐利对焦)来锁定整体感觉。

这就是一个完整的逻辑。你先帮AI理解了原图,然后告诉它新内容是什么,最后用风格和技术参数把所有东西统一起来。

在具体操作中,不同的工具有不同的侧重点。

如果你用的是Midjourney,它的 /remix 模式在扩图时非常有用。开启这个模式后,当你点击扩图按钮(Pan),它会弹出一个对话框,里面已经填好了原图的提示词。这时候你就可以在原有提示词的基础上,添加对延展部分的描述。比如,原提示词是:“A cute cat, anime style --ar 1:1”,你想往右边扩图,可以把提示词改成:“A cute cat sitting on a windowsill, anime style --ar 3:2”。你加入了新的场景元素“sitting on a windowsill”(坐在窗台上),并且调整了长宽比,引导AI去填充新的空间。

如果你用的是Photoshop的生成式填充(Generative Fill),操作更直接。你用选框工具选中要填充的空白区域,然后在弹出的提示词框里输入指令。Photoshop的AI很擅长理解上下文,所以提示词可以更口语化。比如,你框出一片天空,直接输入“cloudy sky at sunset”(日落时的多云天空),它就能很好地结合原图的光线和颜色去生成。但如果你想控制得更精细,同样需要遵循上面的原则,在提示词里加入风格描述,比如“oil painting of a cloudy sky at sunset”(日落时多云天空的油画),结果会更贴近绘画风格。

还有一个技巧是使用负面提示词(Negative Prompts)。这是告诉AI不要画什么。比如,你在扩充一张人像照片时,不希望新生成的手指是畸形的,就可以在负面提示词里加入“deformed fingers, extra limbs, ugly”(畸形手指,多余的肢体,丑陋)。或者你不希望画面变得模糊,可以加入“blurry, out of focus”(模糊,失焦)。这能有效避免一些常见的AI绘图错误,让画面更干净。

另外,权重也很重要。有些工具允许你调整提示词里某个词的权重。比如在提示词里写 (blue sky:1.3),意思就是让“blue sky”这个元素的重要性增加30%。当你发现AI生成的某个部分风格不对时,可以试着增加原图核心风格词的权重,比如 (van gogh style:1.5),来强制AI更严格地遵守这个风格。

总结一下具体的操作步骤:

  1. 分析原图:把主体、风格、光线、颜色、构图这几个要素用关键词记下来。
  2. 构建基础提示词:把第一步的关键词组合成一个完整的句子,用来描述原图。
  3. 添加延展描述:明确说明你要在哪个方向、添加什么具体内容。多用“extend”、“add more of the same”这类词来要求一致性。
  4. 加入风格和技术参数:这是保证融合度的关键。写上相机型号、镜头、光线方向、艺术风格等具体参数。
  5. 使用负面提示词:排除掉你不想要的东西,避免画面出错。
  6. 迭代和调整:第一次生成的结果不完美很正常。你需要根据生成的结果,回头去修改你的提示词。是风格不对?那就加强风格词。是内容不对?那就把内容描述得再具体一点。

这整个过程不像按一个按钮那么简单,它更像是在训练一个学徒。你需要耐心,不断地给它清晰的指令,它才能最终做出你想要的东西。你给AI的信息越是模糊、通用,它产出的结果就越随机。反之,你给它的信息越是精确、具体,它就越能产出与原图完美融合的扩图部分。

赞(0)
未经允许不得转载:蜗蜗助手 » AI扩图提示词怎么写,才能让延展部分的内容和风格与原图完美融合?

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册