蜗蜗助手
让 AI 更懂你

对于不满意的图片,如何通过AI改写提示词进行优化调整?

拿到一张AI画的图,感觉不太对劲,这事儿常有。问题通常不在AI,而在我们没跟它说清楚。AI就是个执行力超强但没啥想象力的实习生,你指令越模糊,它产出的东西就越“惊喜”,或者说“惊吓”。优化不满意的图片,本质上就是学会怎么跟这个实习生沟通,把话说得更明白。

第一步是诊断问题,别急着改提示词。先看着那张不满意的图,问自己:到底哪里不对?是主题错了?比如你想要个“宇航员在沙漠里”,结果出来个“宇航员在沙滩上”。还是构图有问题?主体太小、太大,或者位置很奇怪。又或者是画风不对?你想要个二次元萌妹,它给了你一个写实风格的大妈。也可能是细节崩了,比如多出来一根手指,或者光影效果很奇怪。先把问题具体化,找到病根才能对症下药。

举个例子,我之前想生成一张“一个男人在雨夜的街道上看手机”。出来的图里,男人是个模糊的影子,街道也看不清,整个画面黑乎乎一团糟。我的问题就很明确:主体模糊、环境细节缺失、光影效果差。

找到问题后,第二步就是分析你原来的提示词。把你的提示词拆开看,每个词、每个短语都可能影响结果。AI理解世界的方式是基于它学习过的数据,它会把你给的词汇和数据库里的图像建立关联。 如果你的词太宽泛,它能关联到的图片就太多,结果自然就随机了。

比如我那个失败的例子,最初的提示词是:“man in the rain street at night looking at phone”。
* “man”:什么样的男人?老的少的?穿什么衣服?没说。
* “rain street at night”:什么样的街道?是东京那种霓虹闪烁的,还是伦敦那种古旧的石板路?雨是大是小?没说。
* “looking at phone”:手机屏幕的光有没有照在脸上?这是个很好的光影细节,但我没提。

你看,每个词都太笼gao统,AI只能随便抓一些它觉得相关的元素拼在一起,成品自然不行。

现在进入核心环节:如何动手修改提示词。这有几个可以直接用的方法。

方法一:增加具体细节,别让AI猜

这是最重要的一条。把所有你认为理所当然的细节都告诉AI。AI没有常识,你不说,它就不知道。

回到我那个雨夜的例子,我可以这样丰富细节:
* 主体具体化:“一个穿着黑色风衣的年轻男人” 就比 “man” 好得多。我还可以加上 “表情严肃”、“短发”。
* 环境具体化:“在一条潮湿的、反射着霓虹灯光的东京街道上” 就比 “rain street at night” 精准。 加上“地面有水坑”,细节就更多了。
* 动作和光影具体化:“他低着头,手机屏幕的冷光照亮了他的脸” 这句话直接定义了画面的主要光源和视觉焦点。

所以,修改后的提示词变成了:“一个穿着黑色风衣、表情严肃的年轻男人,站在一条潮湿的、反射着霓虹灯光的东京街道上,他低着头,手机屏幕的冷光照亮了他的脸”。这个版本比原来那个“man in the rain street at night looking at phone”要清晰无数倍。

方法二:明确画风和艺术家风格

如果你对画面的整体感觉有要求,直接告诉AI要哪种风格。它可以是“照片写实主义 (photorealistic)”、“插画 (illustration)”、“水彩画 (watercolor painting)”、“赛博朋克 (cyberpunk)”,甚至是模仿某位艺术家的风格。

比如,我想让那张雨夜的图更有电影感,可以加上 “cinematic lighting (电影光效)”、“dramatic angle (戏剧性角度)”。如果我想要一种特定的赛博朋克感觉,我可以加上 “style of Blade Runner (银翼杀手风格)”。如果我喜欢某个艺术家的用光方式,比如 Greg Rutkowski,我可以直接把他的名字加进去:“by Greg Rutkowski”。这能给AI一个非常明确的风格参考。

方法三:使用“反向提示词” (Negative Prompts)

有时候,你很难描述清楚你想要什么,但你很清楚你不想要什么。反向提示词就是用来做这个的。它可以帮你排除掉那些常见的、恼人的AI生成错误。

常见的反向提示词包括:
* 修正畸形deformed hands, extra fingers, ugly, disfigured (变形的手、多余的手指、丑陋、毁容)。
* 提高图片质量blurry, low quality, watermark, text (模糊、低质量、水印、文字)。
* 排除不想要的元素:比如你在画一幅中世纪的画,不想要现代汽车,就可以在反向提示词里加上 car

这个功能非常实用,几乎是生成高质量图片的标配。在很多AI绘画工具里,都有一个专门的输入框让你填写反向提示词。

方法四:调整关键词的权重

有些时候,AI没能准确把握你提示词里的重点。比如你输入“一个红色的球和一个蓝色的房子”,结果房子的红色很显眼,球反而是蓝色的。这时候就需要调整关键词的权重,告诉AI哪个更重要。

在Stable Diffusion类的工具里,通常用括号和数字来控制权重。 比如 (red ball:1.3) 就是把 “red ball” 的权重增加30%。相反,[blue house:0.8] 就是把它权重降低20%。

在Midjourney里,语法又不一样,它用双冒号加数字,比如 red ball::2 就是让“red ball”的权重变成2。 这个数字越大,AI就会越重视这个元素。通过这种方式,你可以精确地控制画面里各个元素的优先级别。

方法五:一次只改一个变量

这是一个操作原则。当你开始迭代优化提示词时,不要一次把所有东西都改掉。 这样做的话,如果图片变好了,你根本不知道是哪个词起了作用。正确的做法是,一次只修改一个部分。

比如,你先只增加主体的细节,生成几张图看看效果。如果主体对了,你再调整风格。风格也满意了,再微调光影。这个过程有点像做科学实验,控制变量才能找到最优解。这很花时间,但这是提升你提示词写作水平最快的方法。

一个完整的案例拆解

我们来走一遍完整的流程。

  • 初始想法:我想画一个“宇航员在火星上”。
  • 初始提示词astronaut on mars
  • 生成结果:一张很平淡的图。宇航员站姿僵硬,火星就是一片红色沙漠,毫无特色,构图也很普通。
  • 诊断问题:画面平淡、缺乏动感、构图无聊、没有故事性。
  • 开始修改

  • 增加细节和故事性:宇航员在干嘛?我让他“正在插一面旗帜”。火星上有什么?我加上“远处有巨大的峡谷和两颗卫星挂在天上”。修改后:An astronaut planting a flag on Mars, with giant canyons in the background and two moons in the sky.

  • 明确风格和镜头:我不想要一张普通照片,我想要电影大片的感觉。我加上“电影剧照 (film still)”、“广角镜头 (wide-angle shot)”、“史诗感 (epic)”。修改后:Epic film still, wide-angle shot of an astronaut planting a flag on Mars, with giant canyons in the background and two moons in the sky.

  • 优化光影和画质:为了让画面更 dramatic,我加上“戏剧性的光影 (dramatic lighting)”、“黄金时刻 (golden hour)”。为了提升画质,我加上一些通用的高质量词,比如“高度详细 (highly detailed)”、“杰作 (masterpiece)”。修改后:Epic film still, wide-angle shot of an astronaut planting a flag on Mars, with giant canyons in the background and two moons in the sky, dramatic lighting, golden hour, highly detailed, masterpiece.

  • 加入反向提示词:为了避免一些低级错误,我加上:blurry, cartoon, abstract, low quality.

最终,这个提示词从一个简单的“astronaut on mars”,变成了一个复杂但精确得多的指令。这样生成的图片,大概率会比第一张好得多。

总的来说,修改提示词不是一个玄学问题,而是一个逻辑和沟通问题。你需要把脑子里的画面,用AI能听懂的、最精确的语言翻译出来。这个过程需要练习,也需要不断尝试。但一旦你掌握了这些基本方法,你就能从一个只能被动接受AI“惊喜”的用户,变成一个能主动引导AI进行创作的“导演”。

赞(0)
未经允许不得转载:蜗蜗助手 » 对于不满意的图片,如何通过AI改写提示词进行优化调整?

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册