目前主流的根据AI提示词生成图片的软件有哪些，各自的优缺点是什么？-蜗蜗助手

目前市面上能打的AI绘画工具，说白了就那几家巨头，各自都有看家本领，也都有让人头疼的短板。选哪个，完全看你要干什么、有多少耐心以及预算。下面我掰开揉碎了，一个一个讲清楚。

Midjourney：艺术感的天花板，但有点“高冷”

先说Midjourney，很多人心里AI绘画的代名词。这家伙最大的优点就是出图质量高，尤其是艺术感和氛围感，基本是顶级的。你给它一个简单的想法，它就能给你整出一张构图、光影、细节都非常惊艳的图片，风格偏向华丽和梦幻感。对于想快速获得一张能当壁纸、做插画的图，Midjourney基本是首选。

它的操作现在也比以前方便多了。最早必须在Discord那个聊天软件里用，对新手来说有点劝退。现在它也搞了自己的网站，整个流程顺畅了不少。而且社区很活跃，你能看到别人用了什么提示词，直接拿来学习、修改，进步很快。

但是，Midjourney的缺点也很明显。

首先，它不免费。想用就得掏钱，一个月最便宜也得几十块钱，对于只是想尝鲜的人来说，这是个门槛。

其次，它的“想法”太多，有时候不太听话。你想让它画个非常具体、精准的东西，它可能会自作主张加很多艺术化的处理，结果跟你的预期有偏差。比如，你想让它画一个特定产品，它可能会画得特别酷，但产品细节可能就错了。而且，它在处理文字生成上一直是个弱项，虽然最新版有进步，但还是经常出现拼写错误或无法理解的文字。

最后，它的可控性不如其他工具。你没法像Stable Diffusion那样，自己装插件、换模型，深度定制。Midjourney给你什么，你就用什么，自由度比较低。

简单来说 Midjourney：
* 优点：出图艺术感极强，氛围感到位，适合快速出高质量的概念图和插画。
* 缺点：收费，自由度低，对于需要精确控制画面的商业设计来说，有时候不太“听话”。

Stable Diffusion：自由度拉满，但也最折腾

Stable Diffusion（简称SD）是另一个极端，它是开源的，这意味着你几乎可以为所欲为。这是它最大的优点，也是最大的缺点。

优点是极致的灵活性和控制力。你可以把它装在自己的电脑上（只要配置跟得上），完全免费使用。你可以加载别人训练好的各种模型，想画二次元就换个动漫模型，想画写实就换个照片模型。你还能装一大堆叫ControlNet的插件，用来控制人物的姿势、构图、线条，甚至可以把一张图的风格完美迁移到另一张图上。这让SD在精确控制画面细节上，比Midjourney强太多了。对于商业插画、游戏角色设计这类需要反复修改、精确控制的工作，SD是真正的生产力工具。而且因为是本地部署，你的数据也更安全。

但是，它的缺点足以让90%的新手望而却步。

首先是安装和配置极其麻烦。你需要不错的电脑配置，尤其是显卡，没个8G显存跑起来都费劲。整个安装过程涉及代码、环境配置，对电脑小白来说简直是天书。

其次是学习成本非常高。SD的界面参数非常多，各种采样方法、迭代步数、模型权重，每个都影响出图效果。你需要花大量时间去学提示词怎么写，各种插件怎么用，模型怎么搭配。想用好它，不下点功夫是不可能的。

最后，虽然它能实现精准控制，但想出好图，需要你不断地尝试和调整参数。同一个提示词，换个模型，效果可能天差地别。它的出图质量下限很低，上限则完全取决于你的技术和经验。

简单来说 Stable Diffusion：
* 优点：免费、开源，控制力最强，自由度最高，插件和模型生态丰富，是专业人士的首选。
* 缺点：对电脑配置要求高，安装和学习过程复杂，非常折腾人，不适合想立刻出图的新手。

DALL-E 3：最易上手，与ChatGPT无缝衔接

DALL-E 3是OpenAI家的产品，就是搞出ChatGPT那家公司。它最大的优点是集成在ChatGPT Plus里，理解自然语言的能力超强，而且极其容易上手。

你不需要学什么复杂的提示词语法，就像跟朋友聊天一样，直接用大白话告诉它你想画什么就行。比如你可以说：“帮我画一只猫，它穿着宇航服，漂浮在太空中，背景是地球，风格要卡通一点。” ChatGPT会帮你优化这段描述，然后调用DALL-E 3生成图片。这个过程非常自然，对新手极其友好。

DALL-E 3在生成包含准确文字的图片方面，比Midjourney和初版的Stable Diffusion要强得多。你想在图里加个标语或者名字，它大概率能给你整对。另外，它生成的图片风格比较“正”，不会像Midjourney那样过度艺术化，适合做一些商业图表、PPT配图或者社交媒体内容。

缺点方面，首先，你需要订阅ChatGPT Plus才能用，这也是一笔开销。虽然微软的Bing Image Creator也免费提供DALL-E 3的技术，但会有一些使用限制。

其次，它的图像质量和艺术性，通常被认为不如Midjourney。它画出来的东西可能很符合你的描述，但总感觉少了点“灵魂”和惊艳感，比较中规中矩。

最后，它的自定义选项也很少。你不能像Stable Diffusion那样调整各种参数，也不能像Midjourney那样方便地在社区里借鉴别人的作品。基本上就是你说，它画，不满意就重新说。

简单来说 DALL-E 3：
* 优点：对自然语言理解能力强，极其容易上手，和ChatGPT结合体验流畅，生成文字准确率高。
* 缺点：需要付费订阅ChatGPT Plus，图片艺术感和上限不如Midjourney，自定义能力弱。

其他值得一提的工具

除了三巨头，还有一些其他的选择。

Adobe Firefly：Adobe全家桶里自带的AI功能。它的最大优势是版权清晰，因为Adobe声称它的训练数据都是自家图库和无版权内容，所以用它生成的图片拿去商用风险最低。它和Photoshop等软件深度集成，可以直接在PS里用AI生成内容，修改图片，非常方便。缺点是创意和多样性上可能不如前面几家，有时候生成的图像比较“模板化”。

Leonardo.Ai：可以看作一个简化版的、对游戏开发者更友好的Stable Diffusion。它提供了一个可视化的界面，让你能使用很多SD的核心功能和模型，但免去了自己部署的麻烦。它有免费额度，对新手比较友好，社区里也有大量训练好的模型可以直接用，特别适合生成游戏资产、角色和物品图标。

免费替代品：市面上还有很多免费的工具，比如微软的Bing Image Creator（背后是DALL-E 3），还有一些基于Stable Diffusion搭建的网站，比如Ideogram，它在文字生成方面做得不错。这些工具通常有使用次数或速度限制，但对于偶尔玩一下，或者不想花钱的用户来说，是很好的入门选择。

目前主流的根据AI提示词生成图片的软件有哪些，各自的优缺点是什么？

Midjourney：艺术感的天花板，但有点“高冷”

Stable Diffusion：自由度拉满，但也最折腾

DALL-E 3：最易上手，与ChatGPT无缝衔接

其他值得一提的工具

相关推荐

评论抢沙发

评论前必须登录！

热门文章

你的AI灵感库与创作引擎

给想象力一个支点，让蜗蜗助手撬动AI的无限可能。

切换注册登录

切换登录注册

Midjourney：艺术感的天花板，但有点“高冷”

Stable Diffusion：自由度拉满，但也最折腾

DALL-E 3：最易上手，与ChatGPT无缝衔接

其他值得一提的工具

相关推荐

评论 抢沙发

评论前必须登录！

热门文章

你的AI灵感库与创作引擎

给想象力一个支点，让蜗蜗助手撬动AI的无限可能。

切换注册登录

切换登录注册

评论抢沙发