蜗蜗助手
让 AI 更懂你

novelAI提示词的语法结构有什么特别之处,与其他AI绘画工具有何不同?

NovelAI的提示词语法,核心就一条:它更喜欢“标签化”的语言,而不是完整的自然语言句子。这和它的出身有直接关系。NovelAI的图像模型是在Stable Diffusion的基础上,用Danbooru这个大型动漫图片网站的数据集进行了特别训练。 Danbooru上的图片都带有大量的用户标签,比如“1girl”、“long hair”、“blue eyes”、“school uniform”等等。因为模型看的就是这些标签,所以你用同样的语言去跟它沟通,效果自然最好。

这就好比你跟一个只学过菜单的厨师点菜,你说“来一份宫保鸡丁”,他能立刻明白。但如果你说“我想吃点那个,你知道的,就是有点辣有点甜,里面有鸡肉和花生的菜”,他可能就懵了,或者做出来的东西奇奇怪怪。

所以,NovelAI的提示词结构,本质上就是一堆用逗号隔开的标签。 把你想要的所有元素,从角色、外貌、服装,到背景、画风、构图,都拆成独立的标签,然后用逗号拼接起来。比如,想画一个“在樱花树下的蓝眼睛长发女孩”,写成“1girl, long hair, blue eyes, cherry blossoms, school uniform”就要比写成“A girl with long hair and blue eyes is under a cherry blossom tree”效果来得更直接、更稳定。

当然,它也能理解自然语言,毕竟基础模型是Stable Diffusion。 但标签化的写法能让你对画面的控制更精确。

用大括号和方括号控制权重

这是NovelAI提示词最特别的地方,也是它和其他工具的一个核心区别。当你想要AI特别关注某个元素,或者减弱某个元素的影响时,就要用到符号。

  • {} 大括号:加强权重。
  • [] 方括号:减弱权重。

这个操作非常直观。 比如你画一个女孩,同时加了“red dress”和“blue ribbon”两个标签,但生成出来的图片里,丝带的蓝色总是很淡,或者被衣服的红色“污染”了。这时候,你就可以把蓝色丝带这个标签用大括号包起来,变成{blue ribbon}。这样一来,AI就会“更加用力”地去画这个蓝色丝带。

如果你觉得某个效果太强了,比如加了“messy hair”,结果头发乱得像鸟窝,那你就可以用方括号把它括起来,写成[messy hair],它的效果就会被减弱。

更有意思的是,这个括号是可以叠加的。每多加一层大括号,权重就增强一点(大约是乘以1.05倍);每多加一层方括号,权重就减弱一点。 比如{{{masterpiece}}}就是对“杰作”这个标签的极度强调,而[[low quality]]就是对“低质量”的双倍减弱。 这种语法让你可以像调音台一样,精细地调整画面里每个元素的“音量”,而不是只能简单地“开”或“关”。

与其他AI绘画工具的语法差异

搞清楚了NovelAI的“标签”和“括号”,再来看其他工具,区别就很明显了。

和Stable Diffusion的对比

Stable Diffusion (尤其是使用Automatic1111这类WebUI时) 和NovelAI算是同源,所以语法很像,都支持标签式写法。但最大的不同在于加强权重的符号。 Stable Diffusion通常用小括号()来加强权重,而不是NovelAI的大括号{}

举个例子,同样是想强调“红色的裙子”,在NovelAI里是{red dress},而在Stable Diffusion里,你通常会写成(red dress)。如果你想更精确地控制权重,Stable Diffusion还支持带数字的语法,比如(red dress:1.5),表示把这个标签的权重提升到1.5倍。 NovelAI虽然也有类似的数字权重语法(例如1.5::rain),但大家用得更多的还是简单直观的叠括号。

另一个区别在于训练数据。虽然都是扩散模型,但NovelAI是专门针对二次元风格进行优化的。 这意味着它对动漫相关的标签理解得特别好。你想画个“fate stay night”里的“saber”,直接打上角色名和系列名,它就能画出八九不离十的样子。而通用的Stable Diffusion模型可能就需要你更详细地描述角色的外貌特征,比如“blonde hair, green eyes, armor, sword”。

和Midjourney的对比

Midjourney和NovelAI的差别就非常大了。可以说,它们走了两条完全不同的路。

Midjourney不认标签,它更倾向于理解自然语言和艺术性的描述。 你不用像写代码一样去堆砌标签,而是像对一个艺术家说话那样,用描述性的句子来表达你的想法。比如,你想画一幅有未来感的城市夜景,在NovelAI里你可能会写night, city, cityscape, futuristic, neon lights, street

但在Midjourney里,你可能会这样写:“cinematic shot of a futuristic cyberpunk city street at night, glowing with neon signs, wet pavement reflecting the colorful lights, in the style of Blade Runner”。

看到了吗?Midjourney的提示词更像是在讲一个故事,描述一个场景的氛围和感觉。它对艺术风格、镜头类型、光线氛围这些词汇的理解能力很强。

此外,Midjourney的参数调整是放在提示词外面的。比如你想改画幅比例,需要在提示词后面加上--ar 16:9这样的参数。而NovelAI的构图、画幅这些设置,则是在UI界面上直接选择,或者也用标签(如wide shot)来控制。

负面提示词(Undesired Content)的逻辑

最后说说不想要什么。NovelAI专门提供了一个“Undesired Content”(不期望内容)的输入框,也就是我们常说的负面提示词。 它的作用就是告诉AI,哪些东西绝对不要出现在画面里。

这里的语法和正面提示词是通用的。比如,你不想画面里出现多余的手指,就在负面框里写extra fingers, mutated hands。如果你发现AI总是在角落里画一些乱七八糟的签名或水印,就加入signature, watermark, text

同样,大括号和方括号在这里也适用,只不过逻辑是反过来的。 在负面框里用大括号{}加强某个词,意味着“更强烈地避免”这个东西。比如你极其讨厌模糊的图片,就可以写{{{blurry}}}。而用方括号[]减弱,则意味着“没那么讨厌,稍微有一点也可以接受”。

总的来说,NovelAI的语法结构是为“精确控制”而生的。它通过标签化的语言体系和独特的权重符号,让你能像拼乐高一样,一块一块地搭建出自己想要的画面。这和Midjourney那种偏向艺术感觉和自然语言的“写意派”形成了鲜明对比,也比原生Stable Diffusion在二次元领域的控制来得更直接、更“专精”。

赞(0)
未经允许不得转载:蜗蜗助手 » novelAI提示词的语法结构有什么特别之处,与其他AI绘画工具有何不同?

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册