蜗蜗助手
让 AI 更懂你

AI提示词反推工具有哪些

你有没有过这种体验:在网上看到一张AI画的图,效果特别好,心里痒痒的,也想自己做一个。但问题是,你不知道作者用了什么提示词(Prompt)。或者,你用ChatGPT生成了一段很棒的文案,想把这个生成能力固定下来,以后能重复使用,但又不知道当时具体是怎么问的。

这时候,提示词反推工具就能派上用场。

简单说,它干的活儿就是“看结果,猜原因”。你给它一张图片或者一段文字,它帮你分析,然后生成一个或几个最可能生成这个结果的提示词。这东西对于想学习AI绘画或者想优化自己工作流的人来说,挺实用的。

咱们先聊聊最常见的,就是图片反推提示词。AI绘画这东西,提示词就是灵魂。同一个模型,提示词差一点,出来的图可能就完全是两回事。所以,能从好作品里“偷师”学艺,知道别人是怎么描述画面的,进步会很快。

专门为AI绘画服务的图片反推工具

这类工具的核心任务就是分析一张图片,然后把它“翻译”成AI能听懂的语言,也就是提示词。

1. CLIP Interrogator

这个工具算是这个领域的元老之一了。 你给它一张图,它会生成一段描述性的文字。它的工作原理结合了OpenAI的CLIP和Salesforce的BLIP模型,简单理解就是,它既能“看懂”图片里的内容,又能把这些内容组织成自然语言。

举个例子,你上传一张梵高《星夜》的图片,CLIP Interrogator可能会给你这样的提示词:“a painting of a swirling blue and yellow sky with a village and a cypress tree in the foreground, by Vincent van Gogh, expressionism, oil on canvas”。

这个描述很详细,包含了画面内容、作者、艺术风格和材质。你拿着这段话去Midjourney或者Stable Diffusion里跑,虽然不保证能100%复刻原图,但出来的效果在风格和构图上会很接近。

怎么用呢?很简单:
* 找到一个托管CLIP Interrogator的网站,很多AI工具集网站都集成了这个功能。
* 上传你想分析的图片。
* 点击“提交”或者“分析”按钮,等一会儿,它就会给你生成好的提示词。

但它也有个特点,就是生成的提示词通常是一段完整的句子,比较偏向艺术性的描述。有时候,对于需要精确控制标签(tag)的AI绘画模型来说,可能不够直接。

2. DeepBooru

如果你用Stable Diffusion比较多,那你对这个名字可能不陌生。DeepBooru是很多Stable Diffusion WebUI里自带的功能,它的特点和CLIP Interrogator正好相反。 它不会给你生成一个完整的句子,而是生成一大堆用逗号隔开的关键词(tags)。

比如,你上传一张动漫女孩在樱花树下的图片,DeepBooru可能会生成这样的结果:“1girl, solo, long hair, school uniform, cherry blossoms, tree, outdoors, sky, day”。

这种格式对于那些主要靠标签来控制画面的模型特别友好。每个词都像一个开关,精确控制画面里要出现什么元素。它的好处是精准、直接,但缺点是缺少对整体风格、氛围的描述。所以,很多人会把它生成的标签作为基础,再手动加上一些风格、镜头、光照之类的描述词。

在Stable Diffusion WebUI里使用它,一般就在“图生图”(img2img)标签页下,上传图片后,旁边就会有“CLIP反推”和“DeepBooru反推”的按钮。 点一下,提示词就自动填好了。

3. Midjourney的 /describe 命令

Midjourney作为AI绘画领域的佼佼者,当然也内置了类似的功能。它的这个功能叫做 /describe。 你在和Midjourney机器人对话的输入框里,输入 /describe,然后上传一张图片,它就会给你返回四个不同的提示词选项。

这个功能我个人很喜欢,因为它给的不是一个答案,而是四个。这四个提示词往往角度不同,有的侧重描述内容,有的侧重描述风格和构图。这就像请了四个专家帮你分析,你可以看看哪个更符合你的想法,或者把这四个提示词融合一下,创造出一个新的。

比如,我上传一张赛博朋克风格的城市夜景图,它可能会给我四个这样的选项:
1. cyberpunk city street at night, with neon signs and flying vehicles, in the style of blade runner, cinematic lighting --ar 16:9
2. a futuristic cityscape with towering skyscrapers and glowing advertisements, atmospheric, digital art, highly detailed --ar 16:9
3. neon-drenched alleyway in a dystopian city, rain-slicked streets, volumetric lighting, concept art --ar 16:9
4. urban sci-fi scene, holographic billboards, busy traffic, moody, octane render --ar 16:9

你看,每个都抓住了重点,但侧重点不同。而且它还很贴心地帮你把画面比例参数 --ar 16:9 都加上了。你可以直接点击下面对应的数字按钮,用这条提示词重新生成图片。 这对于学习和寻找灵感来说,效率很高。

4. Tagger插件

这是Stable Diffusion WebUI的一个扩展插件,功能和DeepBooru类似,但很多人觉得它分析得更准、更详细。 安装这个插件后,WebUI里会多出一个“Tagger”标签页。你把图片传上去,它可以帮你分析图片内容,并给出一系列的标签。 而且,它还能帮你筛选标签的置信度,把那些它觉得最靠谱的标签排在前面。

它的安装稍微麻烦一点,需要在WebUI的“扩展”页面里从网址安装,输入它的GitHub链接就行。装好重启一下,就能用了。 对于追求更高准确度的Stable Diffusion用户来说,这个插件值得一试。

不只是图片,文字内容也能反推

除了图片,我们有时候也想反推生成某段特定文字的提示词。这个过程通常被称为“Reverse Prompt Engineering”。 它的应用场景没有图片那么广泛,但对于需要批量生成风格统一内容的场景,比如写营销邮件、社交媒体帖子、或者代码解释,就很有用了。

这个操作目前没有像图片反推那样有那么多现成的“一键式”工具,更多的是一种方法论,主要依赖于强大的语言模型本身,比如ChatGPT(特别是GPT-4或更高版本)。

操作步骤大概是这样的:
1. 准备一个范本:找到一段你认为写得特别好的文字。可以是一篇博客文章、一封邮件,甚至是一段代码。
2. “喂”给AI:把这段文字发给ChatGPT,然后给它下指令。
3. 给出明确的指令:你的指令需要清晰地告诉AI你要干什么。你可以这样说:“我希望你分析下面这段文字的风格、语气和结构。然后,请你生成一个详细的、可以重复使用的提示词(prompt template)。当我使用这个提示词并给你一个新的主题时,我希望你能生成和下面这段范文风格类似的文字。”

举个例子,假设你很喜欢某个博主的写作风格,他总是能用很简单的语言解释复杂的技术问题。你可以复制他的一篇文章,然后对ChatGPT说:
“分析以下文章的写作风格。请注意它的语气、句子结构、常用词汇和整体节奏。然后,为我创建一个‘内容创作模板’提示词。这个提示词应该包含变量,比如 [主题][核心观点],这样我以后只需要替换这些变量,就能让你模仿这种风格为我写作。”

AI分析完后,可能会给你这样一个模板:
“请你扮演一位经验丰富的技术博主,你的写作风格是:[这里是AI分析出的风格总结,比如:使用简单直接的语言,避免专业术语,多用比喻和生活中的例子,语气像和朋友聊天]。现在,请围绕主题 [输入你的主题] 撰写一篇博客文章,文章需要阐明以下核心观点:[输入你的核心观点]。文章结构要清晰,多分段,多用短句。”

拿到这个模板后,你就可以把它保存下来。下次需要写新文章时,直接拿出来用,只需要替换主题和核心观点就行了。 这样就大大提高了内容产出的稳定性和效率。

总的来说,提示词反推不管是图片还是文字,核心目的都是为了“解构”优秀的作品,让我们能更高效地学习和创作。它把AI的黑箱稍微打开了一点,让我们能窥见那些好内容背后的“配方”。当然,工具给出的提示词不一定是唯一的正确答案,但它绝对是一个很好的起点。你可以把它当成一个AI助教,帮你分析,给你灵感,剩下的创造力发挥,还是要靠我们自己。

赞(0)
未经允许不得转载:蜗蜗助手 » AI提示词反推工具有哪些

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册