30美金做出30万广告:AI视频创作完整流程拆解
本报告由 AI 深度分析生成,基于视频完整字幕。
导读
这是一期工具型教程,但它的价值远不止于"介绍几个AI工具"。马尔科Mark本人是独立站(DTC电商)从业者,团队销售额接近700万美金,这套流程是他花了一个月、数千美金实测踩坑后整理出来的,并非随便拼凑。
视频用一个完整的实战案例(Liquid Death水品牌30秒广告)从零走完五个步骤:脚本 → 角色 → 分镜 → 视频生成 → 剪辑,最终成本不到30美金。值得一看的不只是工具,更是他对每个环节"为什么要这样做"的逻辑拆解。
背景:这套工作流的来源
传统高质量品牌广告的制作成本:演员 + 专业摄影团队 + 导演 + 编剧 + 特效 = 大几万甚至数十万美金。这条视频要证明的是:用AI工具,一个人可以在家做出同等质感的广告,成本不到30美金。
案例品牌选择了 Liquid Death ——一个把山泉水包装成重金属品牌的DTC传奇。GMV超10亿美金,估值14亿,堪称DTC史上最会讲故事的品牌之一。它所有视频的核心结构:完全离谱的Hook → 夸张荒诞的产品介绍 → 清晰CTA。
完整工具清单
| 环节 | 工具 | 费用 |
|---|---|---|
| 脚本撰写 | Claude | 订阅制(可用免费版) |
| 图像生成 | Higgs Field(nano banana pro模型) | 按量付费 |
| 分镜整理 | Google Doc | 免费 |
| 视频生成 | Higgs Field(Kling 3.0 / Kling 1.5) | 按量付费 |
| 配音 | ElevenLabs(V3模型) | 按量付费 |
| 剪辑 | CapCut | 免费 |
第一步:脚本大纲
核心逻辑:这一步不需要花太多时间,但极为关键——它决定了整条广告的骨架。
流程:打开Claude → 直接描述品牌风格和诉求 → 让Claude生成多个广告方向 → 选定角度 → 让Claude写完整30秒脚本。
Liquid Death案例的方向选择:
Claude给出了多个方向(离婚律师版、婴儿水版、葬礼主题版等),马尔科选了 "For People Who Hate Mornings",理由:这个场景每个人都经历过,早上6点整个人想死,Liquid Death把自己定位成"对抗早晨的武器",反差感极强。
最终脚本骨架:
- 闹钟6点爆炸,两人在床上,男主Derek睁开一只眼
- 旁白:Every morning, something tries to kill you
- Derek从枕头下掏出一罐Liquid Death
- 旁白:But not Liquid Death
- 女友Maya:What are you doing?(从被子里传来)
- Derek缓缓开罐,喝水——头发从凌乱变整齐,眼神从空洞变锐利
- 旁白介绍产品:500mg electrolytes. Zero sugar. Zero artificial anything.
- Derek站起走出画面,顺手给Maya也放了一罐
- 旁白:Murdered in a can. So you can murder your day.
- CTA:Liquid Death. Available online and in stores.
核心反差逻辑:把喝水处理得像战术行动,配上完全没有上线的Maya——"不匹配的严肃感"正是Liquid Death一直在做的事。
第二步:角色创建
这是传统广告里的"选角"环节,AI版本不需要找真人、不需要求朋友帮忙。
平台:Higgs Field → nano banana pro 模型
最关键的发现:用结构化模板,而不是随意描述。
马尔科做了对比实验:
- 模糊描述("一个20多岁的男生,有点懒,没睡醒")→ 每次生成的人脸都完全不同,就算用完全相同的文字也是如此
- 结构化模板 → 四张图高度一致,换场景换角度都能认出来是同一个人
模板包含的信息维度:
- 声音参考(像谁)
- 长相参考(像谁)
- 年龄和身材特征
- 性格和状态(自信还是内敛?)
- 服装和细节
- 姿势和环境
- 光线色调和背景
Derek的完整描述:28岁,普通身材略微驼背,深棕色头发偏长未打理,四天没刮的胡渣,皱巴巴的灰色T恤,深色运动裤,没穿袜子。参考年轻版的Adam Driver或Sebastian Stan的眼神——不是刻意的帅,是那种随时在思考什么的感觉。坐在床上,手肘撑在膝盖上,空洞地看着前方。冷灰蓝色卧室,百叶窗透进晨光。
Maya的完整描述:26岁,娇小,被宽大的灰色卫衣淹没,头发半扎凌乱,脸上可能还有枕头印,一只脚穿袜子另一只不知去哪。完全水平躺着,被子拉到下巴,眼睛要么闭着要么几乎没睁开。参考Florence Pugh的随意感,但更懒更模糊,意识刚刚开始尝试运作但还没成功。
关键技巧:
- 把模板信息发给Claude,拿到结构化的英文prompt,再粘回nano banana生成
- 两个角色必须在相同的环境设置下分别生成——光线、色调、背景完全一致,否则观众会出戏
- 生成完Derek之后,把Derek的图上传作为参考,再生成Maya,最大程度保证两人的光线一致
- 额外生成一张两人同框的场景图,作为开场镜头的基础
免费Prompt模板:视频描述栏提供下载链接。
第三步:分镜设计(Storyboard)
工具:Google Doc(免费,不需要专业软件)
逻辑:分镜是整个项目的地基。用image-to-video的方式生成,每张图都是对应视频片段的第一帧,所以场景图的质量直接决定视频的质量。
场景生成同样需要模板,模板维度包括:
- 镜头构图和取景方式(俯拍/广角/特写)
- 主体和道具细节
- 光线和色调
- 背景元素
- 整体氛围和情绪方向
七个核心场景(以Liquid Death广告为例):
| 场景 | 构图 | 对应台词 |
|---|---|---|
| 1. 闹钟特写 | 极致俯拍,红色数字是唯一光源,手从上方悬停 | (无台词,压迫感) |
| 2. 两人同框 | 静态广角,Derek坐着发呆,Maya平躺 | "Every morning something tries to kill you" |
| 3. 掏罐子 | 低角度贴近床铺,手从枕头下抽出,水珠质感 | "But not Liquid Death" / "What are you doing?" |
| 4. 开罐特写 | 极致特写,拇指压拉环,气泡从开口溢出 | (无台词,开罐声是精华) |
| 5. 喝水变身(两张) | First Frame + Last Frame | "500mg electrolytes..." |
| 6. 站起走出 | 广角静止,Derek已上线,Maya仍躺着 | "Murdered in a can..." |
| 7. 放罐CTA | 低脚特写,手放罐子退出画面 | "Available online and in stores" |
重要技巧:
- Google Doc里只放最终确定的那张图,不放备选——否则后面生成视频时会混乱
- 有实体产品的广告,先去Google下载清晰的产品参考图,上传进nano banana和视频生成工具,AI才能准确还原产品细节(logo位置、罐身比例等)
第四步:视频生成
平台:Higgs Field → Video → Create Video
推荐模型:
- Kling 3.0(视频中称Clean 3.0):综合质量强
- Kling 1.5(视频中称Cdance 1.5):镜头稳定性更好,适合需要完全静止的镜头
提示词四问(打开Enhanced开关后回答) :
- 画面里的人在说什么?语气是什么?
- 镜头在做什么?固定还是移动?
- 角色的动作是什么?
- 场景的背景和氛围是什么?
最核心技术:First Frame + Last Frame(首帧+末帧)
用于"喝水变身"这个关键镜头:
- 上传第一帧:Derek仰头喝水,头发凌乱,眼神空洞,Maya在背景里虚焦躺着
- 上传最后帧:同样构图,但Derek头发整洁,眼神锐利,肩膀往后,整个人变了状态
- Prompt描述中间过程:喝水过程中,头发慢慢整洁,眼神慢慢变锐利,变化克制,不夸张,是细微的物理切换
- AI算法自动计算中间的过渡动画
"这是AI目前为止能让我震撼的地方。这种Transformation手动做要花很长时间,但现在任何人几秒就能做到。"
生成原则:不追求细节完美,只看氛围和节奏是否到位。细节可以通过剪辑修正,但画面的情绪感一旦不对就无法挽救。
第五步:剪辑
工具:CapCut(免费,专为短视频设计,零配置)
流程:把Google Doc放在旁边对照分镜 → 按顺序import所有素材 → 拼接 → 精剪 → 调色 → 加配音 → 加音乐
精剪技巧:
- AI生成的视频开头或结尾往往有瑕疵(闹钟数字乱跳、动作衔接不顺),直接在时间线上Cut掉
- 每个片段剪到刚好够用,不留余量
调色强化情绪弧线:
- 产品出现之前:色温调低(更冷),整个画面更"dead",强化无活力的状态
- 产品出现之后:色温调高(更暖),整个画面更有活力
这个冷→暖的色温变化,对应了Liquid Death"给你能量"的产品承诺,视觉上直接强化了品牌信息。
配音:ElevenLabs V3
- 必须用V3模型,比V2情绪感和真实感强太多
- 导演指令:在台词前后用方括号标注情绪,精准控制语气
- 例:
[depressed] Every morning something tries to kill youvs[excited] Liquid Death!——完全不同的效果
- 例:
- 旁白选择:平零情绪、像在念警察报告的那种声音——越平越好笑,符合品牌调性
- Maya的声音:软气息,句子中途就断掉,强行从深度睡眠里被拉出来的感觉
音乐设计:
- 开场→开罐前:慵懒的背景音乐,营造"早晨没有活力"的氛围
- 开罐后:重金属音乐切入,Liquid Death品牌特色
- 过渡使用fade out / fade in技术,避免音乐太突兀地切换
- 关键音效:开罐声。这是整条广告最重要的音效,音乐进来时必须确保开罐声不被盖掉
- CTA段落:不加任何音乐,让旁白清晰传达信息
关键技术总结
| 技术 | 应用场景 | 解决的问题 |
|---|---|---|
| 结构化Prompt模板(角色) | 角色创建 | 解决AI每次生成人脸不一致的问题 |
| 结构化Prompt模板(场景) | 分镜生成 | 解决AI场景描述过于模糊的问题 |
| 上传产品参考图 | 任何含实体产品的场景 | 确保产品细节(logo、造型)准确 |
| 同环境生成双角色 | 角色创建 | 确保两个角色光线色调一致 |
| First Frame + Last Frame | 需要角色变化的场景 | 精准控制变化的起点和终点 |
| 色温调色 | 剪辑 | 强化情绪弧线(无活力→有活力) |
| 11Labs导演指令 | 配音 | 精准控制语气和情绪 |
| Audio Fade In/Out | 音乐过渡 | 避免不同氛围音乐的硬切换 |
成本测算
- 整套工具:不到30美金
- 马尔科自己花了1个月+数千美金测试工作流(测试成本),但单次广告制作成本极低
- 对比:传统同类广告制作 = 演员+摄影团队+导演+编剧+特效,大几万到数十万美金
金句
"AI工具门槛降低之后,竞争只会越来越激烈。那些真正能赢的人,不是用了最多工具的人,而是对自己的产品、用户、市场理解最深的那群人。"
"用模板给AI提供结构化的输入,生成结果会稳定很多。四张图长得一模一样,换场景换角度都能认出来是同一个人——差距就是这么大。"
"不要因为一些小的细节追求完美。最重要的是画面的氛围和节奏感是你想要的——这个东西之后没办法改。声音可以换,画面的感觉不对,那真的就不行了。"
"先把产品参考图上传给AI,AI就有了视觉参考——罐身细节、logo位置、整体比例都会准确很多。这个方法适用于任何有实体产品的广告。"
"First Frame and Last Frame——从活死人到功能正常人的Transformation。手动做要花很长时间,现在任何人能在几秒钟就能做到。"
时间线索引
| 时间点 | 内容 |
|---|---|
| 00:00 | 开场:用不到30美金做出30万美金广告的承诺 |
| 00:27 | 讲者背景:团队独立站接近700万美金销售额 |
| 01:19 | 视频结构预告:五个板块 |
| 01:52 | 第一步:脚本大纲 |
| 02:10 | 案例品牌Liquid Death介绍 |
| 02:27 | Claude生成广告概念和脚本 |
| 04:12 | 第二步:角色创建 |
| 05:03 | Higgs Field平台介绍,nano banana pro |
| 05:28 | 关键发现:模板 vs 模糊描述的差距对比 |
| 06:12 | Derek角色完整生成流程 |
| 07:30 | Maya角色生成 |
| 08:36 | 两人同框场景图生成 |
| 09:46 | 第三步:分镜设计(Storyboard) |
| 10:11 | Google Doc作为分镜工具 |
| 11:16 | 场景生成模板介绍 |
| 11:46 | 逐个镜头生成(闹钟特写、双人场景等) |
| 14:28 | 上传产品参考图的重要性 |
| 16:01 | 喝水变身镜头的逻辑(First Frame + Last Frame预告) |
| 18:33 | Storyboard完成 |
| 20:03 | 第四步:视频生成 |
| 20:54 | 推荐模型:Kling 3.0 vs Kling 1.5 |
| 21:22 | Enhanced开关 + 四问提示法 |
| 24:10 | First Frame + Last Frame技术详解 |
| 26:10 | 所有视频生成完毕 |
| 26:38 | 配音工具:ElevenLabs |
| 27:22 | V3 vs V2对比,导演指令功能 |
| 28:04 | 第五步:剪辑(CapCut) |
| 31:31 | 调色:色温冷暖变化强化情绪弧线 |
| 32:40 | 音乐和音效设计 |
| 36:09 | Audio Fade In / Fade Out技术 |
| 38:15 | 最终成片预览 |
| 39:06 | 结语:工具不是核心,对产品和用户的理解才是核心 |
评论
还没有评论,来第一个留言吧 ✨