给AI写音乐提示词,本质上就像在跟一个很有才华但没什么主见的音乐人沟通。你给它的指令越清晰,它做出来的东西就越接近你想要的。很多人刚开始用的时候,只会输入“一首开心的歌”,结果AI给你的东西听起来就像十年前的罐头音乐。 这很正常。想要让AI给你打工,你就得学会说它的语言,而这个语言的基础,就是一些基本的音乐理论。

我们先从最核心的四个要素说起:曲风、BPM、乐器、情绪。这四个是基本框架,缺了任何一个,AI都容易“自由发挥”,结果往往不是我们想要的。
第一步:明确曲风 (Genre)
这是所有指令的起点。如果你不告诉AI要做什么风格,它就只能瞎猜。但是,只说一个大概的词是不够的。比如你只说“摇滚”,范围就太大了。是英伦摇滚(Britpop)?是朋克(Punk)?还是金属(Metal)?这些音乐听起来完全不一样。
所以,指令要具体。
* 不好的指令:“摇滚乐”
* 好的指令:“90年代另类摇滚(90s alternative rock)”
* 更好的指令:“一支带有垃圾摇滚(grunge)元素的90年代另-类摇滚,类似Nirvana的风格”
你看,指令越具体,AI的创作范围就越小,结果也就越可控。你可以把不同的风格组合在一起,AI也能理解。 比如,“带有福音元素的灵魂乐(soul music with gospel influences)”或者“融合了日本城市流行(Japanese city pop)元素的Lo-fi嘻哈”。 这种跨界组合往往能带来一些惊喜。
第二步:设定速度 (BPM)
BPM,就是Beats Per Minute,每分钟的节拍数。这个数字直接决定了音乐的快慢和能量感。 比如,60 BPM感觉会很慢、很抒情,适合冥想或者悲伤的场景。 128 BPM是很多电子舞曲(EDM)的常用速度,一听就想动起来。
在提示词里加上BPM,能立刻给音乐定下一个基调。
* 不明确的指令:“一首快节奏的歌”
* 明确的指令:“一首140 BPM的硬核科技舞曲(Hardcore Techno)”
有些AI工具,你甚至可以要求它在歌曲里改变速度。比如用“accelerando”表示逐渐加快,或者用“ritardando”表示逐渐放慢。 这属于进阶用法,但效果很好,能让音乐听起来不那么死板。
第三步:指定乐器 (Instrumentation)
你想在歌里听到什么乐器?直接告诉AI。 AI的乐器库非常庞大,从常见的钢琴、吉他,到一些很偏的民族乐器,它都懂。明确乐器可以帮你塑造音乐的质感。
举个例子,同样是民谣,用木吉他(acoustic guitar)和用电吉他(electric guitar)做出来的感觉完全不同。
* 模糊的指令:“带点吉他的民谣”
* 清晰的指令:“以清脆的钢弦木吉他(crisp steel-string acoustic guitar)为主,配上口琴(harmonica)点缀的民谣”
你还可以描述乐器的演奏方式。比如,不是只说“吉他”,而是说“手指弹拨的木吉他(finger-picked acoustic guitar)” 或者“带有失真效果的电吉他主音(distorted electric guitar lead)”。 还可以指定乐器之间的互动,比如“钢琴和弦乐之间的呼应(call and response between piano and strings)”。 这种细节能让AI生成的音乐更有层次感。
第四步:描绘情绪 (Mood)
情绪是音乐的灵魂。 你想让听众有什么感觉?开心、悲伤、紧张、还是放松? 直接用描述性的词语告诉AI。 尽量用生动、具体的词。
* 通用的指令:“悲伤的音乐”
* 具体的指令:“忧郁、内省的(melancholic and introspective)”
* 更具体的指令:“适合雨夜独自开车的忧郁氛围,带有一丝希望感”
把情绪和场景结合起来,AI更容易理解你想要的东西。 比如,“适合在咖啡馆里放松的慵懒爵士乐(lazy jazz music for a relaxing cafe setting)”或者“为一部惊悚电影预告片制作的紧张、悬疑的管弦乐(tense, suspenseful orchestral music for a thriller movie trailer)”。 这种带有明确用途的描述,往往能得到最好的结果。
当你把这四个核心要素都想清楚了,就可以把它们组合成一个基础的提示词。
例如:“一首关于夏天回忆的日本城市流行歌曲(Japanese city pop),115 BPM,以电钢琴(electric piano)和放克贝斯(funky bass)为主,整体感觉怀旧又带点甜(nostalgic and sweet)。”
这个指令已经很不错了,但我们还可以加入更多音乐理论的细节,让它更专业。
进阶技巧:用结构和调性来控制音乐
如果你懂一点音乐理论,可以给AI更精确的指令,比如歌曲的结构和调性。
歌曲结构 (Song Structure)
一首完整的歌通常有主歌(Verse)、副歌(Chorus)、桥段(Bridge)这些部分。 你可以在提示词里用标签把结构标出来,很多AI工具都能识别。
例如,你可以这样写:
[Intro]
[Verse]
悠闲的节奏,讲述一个夏日午后的故事
[Chorus]
节奏变得明快,旋律朗朗上口,反复唱着‘阳光正好’
[Guitar Solo]
[Outro]
音乐慢慢淡出
这样做的好处是,AI会按照你的蓝图来构建音乐,而不是自己随意组合。 它会知道副歌部分需要更有记忆点,独奏部分要给吉他表现的机会。
调性 (Key)
调性决定了音乐的色彩。简单来说,大调(major key)听起来更阳光、开朗,小调(minor key)则更倾向于忧郁、深沉。 在提示词里直接指定调性,可以很有效地控制音乐的整体情绪。
例如:“一首C大调(C major)的欢快民谣,充满希望感。”
或者:“一段D小调(D minor)的黑暗电影配乐,充满悬疑。”
AI对于调性的理解很准确。如果你发现生成的音乐情绪不对,检查一下是不是调性没选对。
最后,记住要不断迭代
很少有人能一次就写出完美的提示词。最好的方法是,先用一个简单的指令生成一个版本,听一下,然后根据听感来修改和增加细节。
比如,你第一次的指令是:“一首Lo-fi嘻哈”。
听完之后,你觉得节奏有点慢,而且缺少旋律。
那么第二次就可以改成:“一首90 BPM的Lo-fi嘻哈,带有忧郁的电钢琴旋律和黑胶唱片的炒豆声(vinyl crackle)。”
这个过程就像在和AI对话,你不断给它反馈,它就不断接近你的想法。 把AI当成一个工具,而不是一个一键生成奇迹的魔法盒,你的心态会好很多,做出来的音乐质量也会高得多。








评论前必须登录!
注册