蜗蜗助手
让 AI 更懂你

目前市面上有哪些能根据指令生成图片的AI工具比较好用?

市面上能根据指令生成图片的AI工具很多,选哪个确实头疼。我玩过不少,有些真的很好用,有些就比较一般。下面聊聊几个主流的,分享点我的实际经验。

Midjourney:效果惊艳,但有点“门槛”

如果你追求图片的艺术感和创造力,Midjourney是首选。它生成的图片质量非常高,特别是那种充满想象力的、有点奇幻风格的图,效果简直绝了。很多网上流传的获奖AI画作,不少都是用Midjourney做的。

但是,Midjourney用起来稍微有点麻烦。它没有自己的网站或软件,而是嫁接在一个叫Discord的聊天软件里。 你得先注册Discord,然后加入Midjourney的官方服务器,才能开始用。 操作方式也像聊天,输入“/imagine”加上你的描述词(prompt),机器人就会给你生成图片。

怎么用Midjourney:
1. 注册Discord: 先去Discord官网注册一个账号。
2. 加入服务器: 登录后,在Midjourney官网点击“Join the Beta”,就会跳转到Discord的邀请链接,接受邀请就进去了。
3. 开始画图: 在服务器里,随便找一个“newbies”开头的频道,在聊天框里输入 /imagine ,然后敲空格,后面跟上你想画的画面的英文描述,回车发送。
4. 选图和优化: 机器人会一次给你4张图。图片下方有U1、U2、U3、U4和V1、V2、V3、V4按钮。U是Upscale,意思是放大你选中的那张图,得到一张高清大图。V是Variation,意思是基于你选中的那张图的风格和构图,再生成四张类似的新图。

需要注意:
* 付费: Midjourney现在基本是收费的,免费额度很少(大约25次),用完就得订阅。 最低套餐大概每月10美元。
* 全英文: 整个界面和指令都是英文的。
* 公开性: 你生成的图片默认是公开的,频道里所有人都能看到。

总的来说,Midjourney适合那些对图片质量有高要求,不介意花点钱和时间去学习特定操作流程的人。它生成的效果确实对得起它的名气。

Stable Diffusion:最自由,也最复杂

Stable Diffusion是开源的,这意味着你可以把它部署在自己的电脑上,完全免费使用,而且没有数量限制。 这是它最大的优点。自由度极高,你可以加载各种社区大神训练好的模型(Model)和风格插件(LoRA),来实现特定的画风,比如二次元、写实、水墨画等等。

因为是本地部署,所以你的创作是完全私密的。而且,通过各种插件(比如ControlNet),你可以精准控制人物的姿势、构图,甚至可以先画个草稿让AI来完成细节,可控性比Midjourney强得多。

但是,它的缺点也很明显——折腾。

怎么用Stable Diffusion:
1. 硬件要求: 对电脑显卡有要求,最好是英伟达(NVIDIA)的显卡,显存越大越好。
2. 安装部署: 安装过程比较复杂,需要先安装Python和Git,然后通过命令行下载主程序和模型。 对于不懂代码的小白来说,第一步就可能卡住。不过现在网上有很多整合包,比如秋葉aaaki的包,下载解压就能用,大大降低了门槛。
3. 学习成本: WebUI界面上参数非常多,采样方法、步数、CFG Scale等等,每个都会影响出图效果。想用好它,需要花大量时间去学习和尝试。

Stable Diffusion适合爱折腾、有一定技术基础,并且希望对画面有绝对控制权的用户。一旦你掌握了它,它就像一个不知疲倦的画师,可以不受限制地帮你实现各种创意。

DALL-E 3 (集成在Microsoft Copilot/ChatGPT里):最易上手,理解力强

DALL-E 3是OpenAI开发的产品,现在已经集成到了微软的Copilot(之前的Bing Image Creator)和ChatGPT Plus里。 它的最大特点是:极其容易上手,并且对自然语言的理解能力超强。

你不需要学习复杂的指令格式,就像和人聊天一样,用大白话描述你想要的画面就行。 比如你可以说:“画一只戴着墨镜的猫,坐在沙滩上喝汽水,背景是夕阳和大海,风格要像动画片一样”,它能很好地理解这种长句子,并把各个要素都呈现出来。

怎么用DALL-E 3:
* 通过Copilot: 访问微软Copilot的网站,用微软账号登录,直接在对话框里输入描述就可以免费生成图片。 这是最方便的免费使用方式。
* 通过ChatGPT Plus: 如果你订阅了ChatGPT Plus(每月20美元),可以在GPT-4模型下直接生成图片。

优点和缺点:
* 优点: 免费(通过Copilot)、简单易用、对长句子的理解力非常好,出图速度快。
* 缺点: 图像的艺术性和细节精致度,有时候会略逊于Midjourney。自定义和可控性不如Stable Diffusion。

DALL-E 3非常适合新手,或者需要快速根据一个具体想法生成插图的用户。比如给文章配图、做PPT插图,或者就是单纯想把脑子里的某个好笑场景画出来,它都非常合适。

Adobe Firefly:最适合设计师,商业使用有保障

Adobe Firefly是Adobe公司推出的AI图像工具,它最大的卖点是“商业安全”。 Adobe声称Firefly的训练数据全部来自Adobe Stock图库里的授权图片和公共领域的图片,所以用它生成的图片在商业用途上基本没有版权风险。 这对于专业设计师和公司来说,吸引力巨大。

Firefly已经深度集成到了Photoshop、Illustrator等Adobe全家桶软件里。 比如Photoshop里的“创成式填充”(Generative Fill)功能,可以让你轻松地选中一个区域,然后用文字指令来添加、删除或替换这个区域的内容,和现有图片融合得非常自然。

优点和缺点:
* 优点: 商业使用安全,与Adobe生态无缝集成,功能实用,特别适合在现有图片基础上进行修改和扩展。
* 缺点: 如果单独作为文生图工具来使用,它的艺术性和创造力有时候感觉不如Midjourney。同时,它也需要付费订阅Adobe的服务。

Adobe Firefly最适合的人群是设计师,特别是那些重度使用Adobe软件的用户。 它可以作为一个强大的辅助工具,而不是一个纯粹的创意生成工具。

总结一下我的个人建议:

  • 如果你是新手,想快速体验AI绘画的乐趣: 首选集成在Microsoft Copilot里的DALL-E 3,完全免费,而且用起来最简单。
  • 如果你追求极致的图像质量和艺术感,不差钱: 直接上Midjourney,它的效果目前还是标杆级的。
  • 如果你是技术宅,喜欢折腾,追求最高自由度和控制权: 那么Stable Diffusion是你的不二之选。
  • 如果你是设计师,工作流程依赖Adobe软件,且注重商用版权: Adobe Firefly最适合你。

每个工具都有自己的侧重点,没有哪个是绝对的“最好”,关键是看哪个最符合你的需求。可以先从免费的Copilot开始玩,找到感觉后,再根据自己的兴趣和需求决定要不要深入研究Midjourney或Stable Diffusion。

赞(0)
未经允许不得转载:蜗蜗助手 » 目前市面上有哪些能根据指令生成图片的AI工具比较好用?

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册