直接说重点,豆包绘图的提示词,确实有些门道。它和Midjourney、Stable Diffusion的玩法不太一样。用对方法,出图效果好很多,用不对,就感觉它“笨笨的”。
首先要扔掉一个观念:堆砌关键词。很多人习惯用“大师作品,8k,超精细”这类词,以为能提升画质。在豆包这里,作用不大。豆包更喜欢你用正常的、描述性的语言跟它沟通。 别把它当成一个只能识别特定标签的机器,把它当成一个能听懂人话的画师。
举个例子。你想画一个女孩在红墙边抱着猫。
* 旧方法(关键词堆砌):“一个女孩,红墙,抱着猫,插画风格,孤独感,高质量。”
* 新方法(场景化描述):“一个穿着白色连衣裙的女孩,静静地靠在一面斑驳的红墙上。她怀里抱着一只慵懒的橘猫,眼神望向远方,光从侧面打过来,在墙上投下长长的影子。整个画面是有点忧郁的插画风格。”
第二种写法,明显能给豆包更多有效信息,比如“斑驳的红墙”、“慵懒的橘猫”、“侧面打光”、“长长的影子”。这些细节是构成一张好图的关键,而不是那几个空洞的质量词。豆包对这种自然语言的理解能力其实很强,特别是新版的模型。 你描述得越生动,它能捕捉到的氛围和细节就越多。
但是,这不代表关键词完全没用。有些特定的词,确实能直接影响画面质感和风格,可以看作是“独家秘方”。
一、提升质感的“魔法词”
这些词不是那种“最高质量”的空话,而是具体描述画面物理属性的词,加进去往往有立竿见影的效果。
-
光影类:这是最重要的部分,光影决定了画面的层次和氛围。
- 电影光感 (Cinematic Lighting):这个词能让画面光影对比更强烈,更有故事感。
- 体积光 (Volumetric Lighting):就是那种能看到光束的感觉,比如清晨阳光穿过窗户或者森林。这个词能快速增加画面的“呼吸感”。
- 边缘光 (Rim Light):给主体勾上一圈亮边,能让主体和背景立刻分离开,特别适合画人像或突出某个物体。
- 伦勃朗光 (Rembrandt Lighting):一种经典的人像布光,特征是脸部阴影侧会有一个倒三角形的光斑。用这个词能生成更具艺术性和戏剧性的人像。
- 闪光灯,胶片感 (Flash photography, film grain):这个组合能模拟出夜晚用傻瓜相机开闪光灯拍照的效果,画面会有强烈的明暗对比和颗粒感,适合营造复古或纪实氛围。
-
画质与细节类:这些词比“高清”要具体得多。
- 细节丰富 (Rich in detail):直接告诉模型,我需要更多细节。
- 纹理清晰 (Clear texture):强调物体表面的质感,比如衣服的布料纹理、墙壁的粗糙感。
- 锐利对焦 (Sharp focus):让主体部分更清晰,背景可以适当虚化,制造景深。
- 4K, 8K: 虽然前面说堆砌质量词效果不大,但在描述主体后,加上具体的清晰度要求有时会产生积极影响,可以作为辅助。
-
构图与镜头类:帮你控制画面的布局和视角。
- 黄金分割构图 (Golden ratio composition):让画面布局更符合经典美学。
- 对称构图 (Symmetrical composition):适合表现建筑或需要庄重感的场景。
- 特写 (Close-up shot)、中景 (Medium shot)、远景 (Wide-angle shot):这些都是摄影术语,能精确控制主体在画面中的大小和距离。
- 低角度拍摄 (Low-angle shot):从下往上拍,能让主体显得更宏伟、高大。
- 俯视视角 (Top-down view / Bird’s-eye view):从正上方往下看,适合展示大场景的布局。
二、豆包特别偏好的风格关键词
豆包作为一个国产模型,对中国元素的理解和呈现有天然优势。 所以,一些带有“国风”特色的关键词,效果会特别好。
- 水墨画 (Ink wash painting):能生成非常地道的水墨风格,而且可以和不同主题结合,比如“水墨风格的赛博朋克城市”。
- 工笔画 (Gongbi painting):特点是线条精细,色彩浓重,适合画人物和花鸟。
- 剪纸艺术 (Paper-cutting art):能生成具有民俗特色的平面化艺术风格。
- 国潮 (Guochao):这个词比较宽泛,但豆包能理解它的核心,就是传统元素与现代设计的结合。你可以用它来生成一些潮流插画或设计。
- 清朝、唐朝、宋朝服饰 (Qing/Tang/Song dynasty clothing):当需要绘制特定朝代的古风人物时,直接写出朝代名称,豆包能相当准确地还原对应时期的服装和配饰风格。
除了国风,豆包对一些主流的二次元和艺术风格也支持得很好。
* 日漫风格 (Japanese anime style):生成的动漫图片效果不错。
* 吉卜力工作室风格 (Studio Ghibli style):能模仿出宫崎骏动画电影里那种清新、治愈的画面感。
* 新海诚风格 (Makoto Shinkai style):特点是极致的光影和绚烂的天空。
* 扁平插画 (Flat illustration):适合做一些现代感的UI设计或商业插图。
三、一些结构化的技巧
虽然豆包鼓励自然语言,但也支持一些结构化语法来做精确控制。
-
使用括号和权重:这个技巧在其他AI绘画工具里也很常见。用
( )括住一个词可以增加它的权重,让模型更重视它。比如一个巫师,戴着(巨大的)帽子,会让帽子比正常描述更大。 更精确的方式是使用冒号加数字,比如(红色汽车:1.5)就是把“红色汽车”的重要性提升到1.5倍,而(蓝色汽车:0.5)则是减弱它。 当画面元素太多,主体不突出时,这个方法很有用。 -
负面提示词:如果你不希望画面里出现某些东西,可以用负面提示词。虽然豆包没有一个专门的输入框,但你可以在提示词的最后加上一句“不希望出现…”或“避免…”,有时会有效果。但这个功能的稳定性不如专门的负面提示框。
-
分步描述:对于复杂的场景,可以尝试把指令拆分成几个步骤。比如,先描述主体:“一个穿着铠甲的骑士,手持长剑。” 然后描述环境:“他站在悬崖边上,背后是暴风雨的天空和翻滚的乌云。” 最后指定风格和氛围:“整体是黑暗奇幻风格,油画质感,气氛紧张。” 这种结构化的描述方式,能帮模型更好地理解各个元素之间的关系。
总而言之,用好豆包的关键在于“描述”而不是“命令”。先把脑海中的画面用具体的语言描绘出来,再去利用那些能提升质感和风格的“魔法词”进行点缀和强化。多尝试组合不同的光影、镜头和风格词,慢慢就能找到最适合自己需求的那套“独家”词库了。





评论前必须登录!
注册