蜗蜗助手
让 AI 更懂你

如何反推图片提示词并在此基础上进行二次创作?

你看到一张AI画,觉得特别好,想知道它是怎么画出来的,甚至想在它的基础上做点修改,变成自己的东西。这个过程,其实就是反推图片提示词(Prompt),然后二次创作。这事儿不难,但有点小技巧。

第一步:先搞明白AI是怎么“看”图的

我们看一张图,看到的是画面、颜色、构图。AI看图,看的是“标签”和“数据”。它会把一张图分解成一堆关键词,比如“一个女孩”、“金色头发”、“森林里”、“阳光透过树叶”、“写实风格”、“虚化背景”。你反推提示词,就是猜AI用了哪些关键词来画这张图。

反推提示词主要有两种路子:一种是全自动的,用工具;另一种是半自动的,工具加人脑。

第二-步:用现成的工具直接“扒”词

现在很多AI绘画工具都自带了反推功能,这让事情简单了很多。

1. Midjourney 的 /describe 命令

如果你用Midjourney,那/describe命令就是最直接的工具。 你只要在输入框里打上/describe,然后把你想分析的图片传上去,它就会吐出四个风格和内容都比较接近的提示词给你。

这四个提示词不是标准答案,更像是四个不同角度的“解读”。它们会给你很多灵感。比如一张风景照,它可能会给你一个偏向“印象派”的描述,另一个偏向“写实摄影”的描述。你可以在这些描述的基础上直接点按钮生成新图片,或者把这些词复制出来,自己修改。

举个例子,我上传了一张傍晚海滩的油画图片。/describe给了我四个选项:

  • an oil painting of a beach at sunset, in the style of romantic seascapes, dark orange and light blue, calming, detailed marine views --ar 16:9
  • a painting of a beach with a wave crashing on it, in the style of Barbizon school, orange and cyan, monumental murals, emotional, dramatic scenes --ar 16:9
  • the beach at sunset, in the style of intense emotional expression, light brown and dark cyan, nature-inspired, detailed brushwork --ar 16:9
  • a painting of a beach at sunset with a wave coming in, in the style of romanticism, dark amber and azure, captures the essence of nature, grand, epic scenes --ar 16:9

你看,它不仅猜了内容(海滩、日落、海浪),还猜了风格(浪漫主义、巴比松画派)、颜色(橙色、青色),甚至构图比例(--ar 16:9)。这就是一个很好的起点。

2. Stable Diffusion 的反推工具 (CLIP Interrogator)

Stable Diffusion因为是开源的,所以有很多第三方的工具可以用。其中最出名的就是CLIP Interrogator。 不少Stable Diffusion的WebUI(比如AUTOMATIC1111)都集成了这个功能,通常在“图片信息”(PNG Info)标签页下。你把一张AI生成的图片拖进去,它就能读出生成这张图用的提示词和各种参数。

如果这张图不是AI画的,或者没有这些信息怎么办?那就可以用CLIP Interrogator的正经功能。它会分析图片内容,然后生成一段描述性的提示词。 它的工作方式和/describe有点像,但更侧重于识别画面里的具体元素。比如,它会很细致地告诉你“一个穿着红色裙子的女人站在一棵橡树下”。

现在还有一个升级版的CLIP Interrogator 2,它在Hugging Face上可以免费用。你传图上去,它会分析得更细,告诉你主体、媒介(比如是照片还是油画)、风格、艺术家、甚至一些细节。

3. 一些在线反推网站

除了这些集成在工具里的功能,还有很多专门做反推提示词的网站。比如img2prompt这样的网站,你把图片传上去,它直接给你一段提示词。 这种工具的好处是方便,不用安装任何东西。但缺点是,它可能没法像Midjourney或者CLIP Interrogator那样,给你那么多风格化或者艺术家的建议。它更像一个看图说话的工具。

第三步:机器不够,人脑来凑

工具给你的词,通常只是一个“毛坯房”,你要想住得舒服,还得自己“精装修”。二次创作的关键,就在于修改和优化这些机器给你的提示词。

1. 拆解和重组提示词

机器给的提示词可能很长,一堆词揉在一起。你要做的第一件事,就是把它拆开看,理解每个词是干嘛的。一般来说,一个好的提示词结构包含几个部分:

  • 主体 (Subject): 图里最主要的东西是什么?比如“a girl”、“a castle”。
  • 细节 (Details): 主体有什么特征?比如“a girl with long blonde hair”、“a medieval castle on a mountain”。
  • 环境 (Environment): 主体在什么地方?比如“in a dark forest”、“under a starry night sky”。
  • 风格 (Style): 这是什么风格的画?比如“oil painting”、“anime style”、“photorealistic”。
  • 艺术家 (Artist): 想模仿哪个艺术家的风格?比如“by Van Gogh”、“in the style of Hayao Miyazaki”。
  • 构图与参数 (Composition & Parameters): 画面怎么安排?比如“wide angle shot”(广角镜头)、“close-up”(特写),以及一些技术参数像“–ar 16:9”(长宽比)。

把反推出来的词,按照这个结构去分类。然后你就可以开始修改了。

2. 精准替换和添加

假设反推出来的词是“a girl in a forest, oil painting”。这个描述太宽泛了。你可以开始做加法和替换:

  • 换主体: 不想要女孩了,可以换成“a wolf in a forest”。
  • 加细节: 想要一个具体的女孩,可以改成“a girl with red hair and a blue dress”。
  • 改环境: 不想要普通的森林,想要个魔幻点的,可以改成“in an enchanted forest with glowing mushrooms”。
  • 定风格: “oil painting”太笼统,是哪个流派的?可以改成“impressionist oil painting”(印象派油画)。
  • 找参考: 如果你喜欢某个画家的风格,直接加上他的名字,比如“in the style of Claude Monet”。AI模型在训练的时候学习了大量艺术家的作品,直接用名字比用一堆形容词描述风格更准。

3. 用“负面提示词”做减法

二次创作不光是加东西,也要减东西。很多时候,AI会画出一些你不想要的东西,比如多出来的手指、奇怪的背景人物。这时候就要用负面提示词(Negative Prompts)。

比如,你想要一张干净的人像,但是AI老是画出很乱的背景,你就可以在负面提示词里加上“crowd, buildings, clutter”(人群、建筑、杂乱)。如果你不想要模糊的画质,可以加上“blurry, out of focus”。善用负面提示词,能帮你去掉很多干扰项,让画面更接近你的想法。

4. 调整权重

有时候,一个提示词里有多个元素,你想让某个元素更突出一点。这时候可以用权重。在Stable Diffusion里,你可以用括号和数字来调整权重,比如(red dress:1.3),意思就是让“红色裙子”这个特征的权重增加30%,AI就会更强调这个部分。反之,(blue dress:0.8)就是减弱它的影响。

通过这种“加加减减”和调整权重的方式,你就能在反推出来的提示词基础上,创作出完全属于你自己的作品。它保留了原作你喜欢的部分,又加入了你自己的想法。

这个过程,其实比完全从零开始想要有趣。因为它给了你一个很高的起点,你不用从“a girl”这种最基础的词开始猜。你等于站在了别人的肩膀上,然后去一个你想去的新地方。多试几次,你就会发现,反推和二创,是学习和提升AI绘画技巧最快的方法之一。

赞(0)
未经允许不得转载:蜗蜗助手 » 如何反推图片提示词并在此基础上进行二次创作?

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册