想让AI帮你写短视频脚本,最常遇到的问题是,它给你的东西要么平淡得像白开水,要么就是一堆信息,根本没法拍。直接说“写一个关于XX的脚本”,AI多半只会给你一篇浓缩版的说明文。因为它不知道短视频的逻辑,不懂得怎么在几十秒内抓住人心。问题出在,你没有教它。
一个好的短视频脚本,必须有“钩子”,有内容,有转折,还要有结尾,这就是我们常说的“起承转合”。而且,它还需要告诉摄影师和剪辑师,画面应该长什么样。这些都得在提示词里说清楚。
我们先来拆解一下“起承转合”在短视频里到底是什么。
“起”就是开头三秒钟的钩子。 它的任务只有一个:让观众停下来,别划走。常见的钩子是提一个颠覆认知的问题,或者展示一个出乎意料的画面。所以在给AI的提示词里,你不能只说“给我一个吸引人的开头”,这种要求太模糊。AI理解不了什么是“吸引人”。
你得把要求具体化。比如,你可以这样写:
“任务: 为一个关于‘黑洞’的科普短视频写脚本。
开头(起): 脚本必须以一个反常识的问题开始,直接挑战观众的普遍认知。例如,‘如果我告诉你,掉进黑洞可能不会死,你会相信吗?’。这个问题的目的是在3秒内引发好奇心。”
看,这样AI就明白了,它的任务不是写一个平淡的介绍,而是要设计一个“问题”作为钩子。它会围绕这个具体的指令去思考,而不是漫无目的地生成一堆正确的废话。
接下来是“承”,也就是接续开头,开始阐述核心内容。 钩子已经把人留住了,现在你要快速给出一些信息,满足他们的好奇心。这部分是视频的骨架,要有干货,但不能太复杂,点到为止。
在提示词里,你要告诉AI在这一步该做什么。接着上面的例子,你可以这样写:
“发展(承): 在提出问题后,用15-20秒的时间,快速解释为什么会有‘掉进黑死不了’这种说法。这里需要引用一个具体的理论,比如‘信息悖论’或者‘霍金辐射’,但必须用最简单的语言解释,就像对一个12岁的孩子说话一样。不要用专业术语堆砌。”
这个指令里有几个关键点:
1. 时间限制: “15-20秒”,这让AI知道内容的密度和节奏。
2. 具体内容: “引用一个具体的理论”,这就给了AI一个明确的抓手。
3. 语言风格: “用最简单的语言解释”,这确保了内容的易懂性。
没有这些具体的规定,AI可能会给你一段大学物理课的讲稿,根本没法用。
然后是关键的“转”,也就是转折。 这是让一个视频变得有趣、有深度的核心。平铺直叙的内容观众很快就会腻。转折可以是提出一个意想不到的观点,揭示一个普遍的误解,或者从一个完全不同的角度切入。
在提示词里,“转”是需要重点设计的。你可以这样写:
“转折(转): 在解释完理论后,立即提出一个转折。这个转折点要指出前面理论的局限性或是一个更惊人的事实。例如,‘但这一切都只是理论。现实是,在接近黑洞的瞬间,你会被一种叫做‘意大利面化’的效应撕成碎片。’ 这个转折的目的是制造冲突感和戏剧性。”
这个指令清晰地告诉AI,现在需要“制造冲突”。它会理解到,这里的任务不是继续解释,而是要打破前面的铺垫,给观众一个“没想到吧”的瞬间。这种反差感正是短视频吸引力的来源。
最后是“合”,也就是结尾。 结尾要干脆利落,要么总结观点,要么留下一个引人深思的问题,或者直接给出行动号召。短视频最忌讳的就是啰嗦的结尾。
给AI的指令也要同样直接:
“结尾(合): 用一句话总结整个视频的核心观点,并留下一个开放性问题让观众去评论区讨论。例如,‘所以,黑洞是宇宙的终点还是新的起点?在评论区告诉我你的想法。’ 结尾必须在5秒内完成,要强劲有力。”
通过这“起承转合”四个步骤的拆解,你给AI的不再是一个模糊的指令,而是一个清晰的、结构化的写作框架。AI就像一个员工,你给他一个明确的SOP(标准作业程序),他就能给你一个八九不离十的结果。
但是,只有文字脚本还远远不够。短视频是视觉的艺术,画面甚至比文案更重要。所以,你的提示词里必须包含对“画面”的描述。
怎么做?你得让AI扮演两个角色:一个编剧,一个导演。最好的方法是在提示词里建立一个格式,强制AI同时输出文案和画面描述。
你可以用一个简单的表格结构来规范它。比如,在整个提示词的最开始就定下规矩:
“输出格式: 请严格按照以下格式生成脚本,分为‘镜头画面’和‘旁白/文案’两列。”
然后,在“起承转合”的每一个部分,你都要对画面提出具体要求。
我们把上面关于黑洞的例子变得更完整:
“你是一位顶级的短视频科普博主,擅长用震撼的视觉和悬念十足的文案,在60秒内讲清楚一个复杂的科学知识。
任务: 创作一个关于“黑洞”的60秒短视频脚本。
核心主题: 探讨“掉进黑洞会发生什么”,重点突出“理论上的可能性”与“残酷现实”之间的反差。
输出格式:
严格按照两列格式输出:
| 镜头画面 | 旁白/文案 |
|—|—|
脚本结构(起承转合):
1. 起(1-5秒):制造悬念
* 画面要求: 视频开始是一个极具视觉冲击力的黑洞吞噬星球的动画特写,风格要科幻、写实。镜头快速推进,仿佛观众正在冲向黑洞。
* 文案要求: 用一个反常识的问题作为开场白。
2. 承(6-25秒):理论解释
* 画面要求: 画面转为用简洁的动画线条,解释“信息悖论”或“霍金辐射”理论。比如,一个物体的信息像像素一样被黑洞表面记录下来。画面要明亮、清晰,科技感强,不要复杂。
* 文案要求: 用通俗的语言解释理论,说明为什么有科学家认为信息不会丢失。
3. 转(26-45秒):残酷现实
* 画面要求: 画面风格突变。一个宇航员的模型被拉伸,像面条一样被扯开,做成“意大利面化”的特效。画面色调变暗,背景音乐变得紧张。要给出宇航员主观视角下,视野被扭曲撕裂的镜头。
* 文案要求: 制造转折,揭示理论和现实的巨大反差,直接说出“意大利面化”这个概念。
4. 合(46-60秒):总结与互动
* 画面要求: 镜头拉远,最终定格在一个宏伟的星系画面上,黑洞位于中心,神秘而遥远。最后画面上出现文字:“你认为呢?”
* 文案要求: 总结观点,并以一个开放性问题结尾,引导用户评论。
现在,你再看这个提示词。它包含了角色扮演、任务目标、输出格式、完整的四段式结构,并且在每一个结构里,都对“画面”和“文案”提出了极其具体的要求。
这里面没有一个词是废话。比如,对画面的要求不是“好看点”,而是“黑洞吞噬星球的动画特写”、“简洁的动画线条”、“宇航员模型被拉伸”,这些都是可执行的视觉指令。AI拿到这样的提示词,它输出的脚本就会是一个可以直接拿去制作的蓝图,而不是一篇文章。
这种方法的本质,就是你把自己的思考过程、你对一个好视频的理解,全部翻译成了AI能听懂的指令。你做得越细,AI的结果就越接近你的预期。别指望AI能猜到你的心思,你必须把规则说得清清楚楚。





评论前必须登录!
注册