蜗蜗助手
让 AI 更懂你

不同的AI绘画大模型提示词语法和侧重点有何不同?

喂,我们来聊聊AI绘画的提示词(Prompt)。这东西听起来好像很简单,不就是打字告诉AI画什么吗?但如果你真的玩过不止一款AI绘画工具,比如Midjourney、Stable Diffusion或者DALL-E 3,你就会发现,同样一句话丢进去,出来的画风可能差了十万八千里。

这背后其实是不同模型的“脾气”和“语言习惯”不一样。它们就像来自不同地方的人,有自己的方言和理解世界的方式。想让它们画出你脑子里的那幅画,你就得懂它们的语言。

Midjourney:追求艺术感的“氛围大师”

咱们先说Midjourney(MJ)。MJ就像个艺术家,你跟它说话不用太啰嗦,它特别擅长抓氛围和感觉。它的语法更侧重于用简短、有力的词组来激发创意。

语法特点:关键词驱动,逗号分隔

MJ的提示词结构通常是这样:主体内容,风格描述,构图光照,最后再加一些参数。词和词之间用英文逗号隔开就行。

举个例子,你想画一只赛博朋克风格的猫在下雨的东京街头。

给MJ的提示词可能是这样的:
a cyberpunk cat, in the rainy streets of Tokyo, neon lights, glowing eyes, cinematic lighting, ultra detailed, --ar 16:9

你看,这里都是一些核心的词组,比如“赛博朋克猫”、“下雨的东京街头”、“霓虹灯”。MJ会把这些元素很艺术性地融合在一起。

权重设置:简单直接的双冒号

如果你想让某个元素更突出,MJ的语法也很直接。用双冒号 :: 加上数字就行。 比如,你想让“猫”这个主体更重要,“东京街头”只是个背景,可以这么写:

a cyberpunk cat::2, in the rainy streets of Tokyo::1

这里的 ::2::1 就代表了权重比例,数字越大,AI就会越重视这个部分。 默认权重是1,所以 ::1 其实可以不写。这个方法很管用,能帮你精确控制画面的主次。

参数控制:双破折号的“魔术棒”

MJ还有个特点,就是有很多以 -- 开头的参数,像 --ar 16:9 (aspect ratio) 用来控制画面比例,--style 用来调整风格化程度,--no 用来排除不想要的元素(比如 --no humans 就是不要出现人)。

总的来说,玩MJ就像在和一个很有灵气的画家合作,你给出关键点,它负责把画面渲染得充满艺术感。它的强项在于整体氛围的营造和风格化处理。

Stable Diffusion:技术宅的“精密仪器”

接下来聊聊Stable Diffusion(SD)。如果说MJ是艺术家,那SD就是个工程师。它给了你极大的控制权,但前提是你得学会它那套有点复杂的“技术语言”。SD是开源的,这意味着有大量的社区模型和工具,玩法也更多样。

语法特点:精细复杂的权重控制

SD的提示词也用逗号分隔,但它在权重控制上玩得更花。最常见的语法是用括号和数字来调整权重。

比如,(word:1.5) 表示把“word”这个词的权重增加到1.5倍。 (word:0.8) 则是减弱它的影响。 还有一种更简单的写法,用圆括号 () 来增强,用方括号 [] 来减弱。 每加一层圆括号,权重就乘以1.1倍;每加一层方括号,权重就除以1.1倍。

举个例子,画一个“穿着红色连衣裙的女孩”,你特别想强调“红色”。

在SD里可以这么写:
a girl wearing a (red:1.5) dress
或者
a girl wearing a ((red)) dress

这两种写法都能让裙子的红色更加鲜明,但如果你权重加得太高,画面可能会崩掉,出现一些奇怪的东西。这是因为你过分强调某个概念,破坏了模型内部的平衡。

负面提示词(Negative Prompts):明确告诉AI“不要什么”

SD一个很核心的功能是负面提示词。 你可以非常具体地告诉模型,画面里绝对不能出现什么。比如,画手的时候很容易画出六个手指,你就可以在负面提示词里写 extra fingers, deformed hands。或者你不想要模糊、低质量的画面,就加上 blurry, low quality

这个功能非常实用,能帮你过滤掉很多不想要的结果,大大提高了出图的成功率。MJ虽然也有 --no 参数,但SD的负面提示词系统要强大和灵活得多。

语法进阶:词序和组合

在SD里,提示词的顺序也很重要。一般来说,越靠前的词,权重越高。 而且SD还有一些高级语法,比如 [from:to:when] 可以在生成过程的某个步骤之后,把一个词换成另一个词。 还有 [A|B] 语法,可以让模型在A和B两个概念之间交替生成。

总而言之,用SD就像在操作一台精密的仪器,你需要了解每个旋钮和参数的作用。它的上限很高,能实现各种天马行空的想法,但学习成本也相对更高。

DALL-E 3:“会聊天的”创意伙伴

最后说说DALL-E 3。DALL-E 3现在基本上和ChatGPT深度绑定了,所以它的最大特点就是“自然语言理解”。 你不需要像MJ或SD那样去记各种复杂的语法和参数。

语法特点:像聊天一样写提示词

用DALL-E 3,你可以直接用完整、描述性的句子来跟它沟通。 它更像一个能听懂人话的创意助手。

还是那个赛博朋克猫的例子,给DALL-E 3的提示词可以是这样的长句子:

"Create a photorealistic image of a sleek cyberpunk cat. The cat is sitting on a wet asphalt street in Tokyo at night. The scene is illuminated by vibrant neon signs from the surrounding buildings, casting colorful reflections on the puddles. The cat has piercing, glowing blue eyes and some subtle robotic enhancements on its body. The overall mood should be cinematic and slightly melancholic."

你会发现,这段话就像在给一个人类画师描述需求一样。DALL-E 3(或者说它背后的GPT-4)会先理解你这段话,甚至可能会帮你优化和扩充提示词,然后再去生成图片。 这种方式对新手特别友好,你想到什么就可以直接说什么。

侧重点:语义理解和精准性

DALL-E 3的强项在于对复杂句子的理解能力,以及生成包含文字的图片。比如,你想在一张海报上精准地写上“Hello World”,DALL-E 3的成功率要比MJ和SD高得多。

但是,它也牺牲了一部分用户的直接控制权。你很难像SD那样去微调某个词的权重,或者使用复杂的参数组合。 有时候它会“过度解读”你的意思,加入一些你没提到的细节。你需要通过不断地对话和迭代来修正结果。

如何选择?看你的需求和风格

好了,说了这么多,到底该用哪个?这没有标准答案,完全看你想干什么。

  • 如果你追求艺术感和氛围感,喜欢快速出效果,不想折腾太多技术细节,那Midjourney是你的菜。它的默认画风就很讨喜,社区也非常活跃。

  • 如果你是个控制狂,喜欢深入研究技术,希望对画面的每一个细节都有绝对的掌控力,那Stable Diffusion是你的不二之选。它能让你训练自己的模型,实现真正个性化的创作。

  • 如果你是新手,或者希望用最自然、最符合直觉的方式来生成图片,特别是需要处理一些包含文字的设计,那么从DALL-E 3开始是最好的选择。它几乎没有学习门槛。

当然,现在很多AI绘画工具也在互相学习。MJ开始提供更精细的控制功能,而一些基于SD的工具也在努力简化操作界面。未来,这些模型的界限可能会越来越模糊。但就目前来说,理解它们各自的“性格”和“语言”,是让你手里的AI画笔变得更听话的关键。

赞(0)
未经允许不得转载:蜗蜗助手 » 不同的AI绘画大模型提示词语法和侧重点有何不同?

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册