抄别人的提示词永远做不出同款爆款?常见症结不在模型,而在“对话—验证—迭代”的流程缺环。本文以“狩猎女神”为例,拆解从关键帧截图到最终短片的完整链路,手把手示范“多轮抽卡”心法,并把每一步踩过的坑、闪光的技巧毫无保留地告诉你。读完即可复刻任何同类题材。
目录
- 关键帧截图:如何一秒锁定动作高潮
- 大模型反推:Gemini/GPT 高效拆解视觉元素
- 豆包快速验证:30 秒读懂提示词与生图差异
- 多轮对话抽卡:带队形、调姿势、改服饰的无限微调
- 视频提示词:把静态神图转成电影分镜
- 即梦生片:上字幕、修瑕疵、一键出片
第一步:精准截图——记住动势线而非只看脸
操作重点
- 静音播放,在动作高潮暂停(弦拉满=张力 MAX)。
- 手机录屏 0.5 倍速慢放,截取三帧,每一帧标注身体朝向、光影方向。
- 关键词提醒:弓弦、背肌线条、侧逆光发丝轮廓。
常见错误
✅ 不截满屏:去掉顶部 UI、底部进度条。
❌ 直拍屏导致摩尔纹;请用系统截图或录屏转帧。
第二步:大模型反推提示词——把图“翻译”成语言
向 Gemini 或 GPT-4o 输入截图,同时给出以下模板:
请用英文生图 Prompt 描述这张截图,格式:
主体,服饰细节,动作,镜头视角,光线,色调,电影感关键词。
输出字段请勿出现换行,总词数 50–80。示例返回
epic hunt goddess, bronze armor with crescent shoulder guards, drawing longbow in mid-stride, low-angle tracking shot, rim light from sunset, muted earth tones, cinematic depth of field 35mm
把返回结果复制到备忘录,后面不断微调。
第三步:豆包生图初体验——一图看懂提示力度
打开豆包 > 文生图,粘贴 Prompt,设置:
- 风格:胶片写实 35mm
- 比例:16:9 竖版(方便后续剪成短片)
- 步数:30–40
- CFG:7–9
运行 4 张图后,放一起看:
若出现服装纹路错误、人物比例变形,记下词汇并在下一步“抽卡”逐一修正。
😃 小秘籍:同样 Prompt 连续跑 4 次,常能收获隐藏惊喜。
👉 一次性解锁 AI 生图「隐藏款」实操手册
第四步:多轮对话抽卡——高手都在用的无限微调术
问题清单
- 军队阵列不齐?
- 箭袋缺细节?
- 面部表情太僵硬?
对话模板(直接向模型提问)
“请保留现有姿势,把肩甲改为羚羊角造型,调整披风层次感,输出新版 Prompt。”
“女孩嘴角微抿增加杀气,背景加强前景虚化的蒲公英光斑,更新 Prompt。”
每改一次立即回豆包跑图,这一轮又名“抽卡”。记住:
- 不改原意,只改细节,避免提示漂移。
- 单独控制变量,一次只调 1–2 处。
- 建“PR 表”(Prompt Record):第 1 版、第 2 版……方便回滚。
⚠️ 真实案例
第 5 轮终于把“背光发丝数量”提到 90% 还原度;再玩 2 轮,色调从冷蓝调为暖棕,氛围瞬间提升。
第五步:生成视频提示词——让静态神图动起来
向同一模型输入最终满意图加指令:
Based on the attached image, generate a 10-second cinematic script prompt for a vertical 9:16 short video.
Include: camera movement, subject motion, ambient sound cues, color grade plan, frame rate 24fps.返回示例
无人机拉近→环绕 180°→特写女神拉弦——慢动作箭支离弦→金色残影粒子掠过→叠加心跳低频→色调推暖、对比+10 → 淡出黑场。
把脚本粘回文档,同步保存声音关键词(心跳、风噪、弦颤)。
第六步:AI 成片——即梦一键渲染 + 修复小瑕疵
在即梦打开“图生视频”,设置:
- 输入图:第 9 轮抽卡冠军 PNG
- 视频脚本:复制第五步输出
- 总时长:10 秒
- 风格:电影写实 24fps
- 去闪烁:打开
生成后常见 BUG
- 箭支飞出时断裂 → 输出片段导入 CapCut 手动叠帧,多复制 2 帧箭支。
- 人物手部抖 → 关闭即梦的“随机性”,调低至 0.25。
导出成片,配乐 ≈ BPM 80 史诗鼓点,剪映套 LUT“Bronze Goddess 2024”。
FAQ:写给还在踩坑的你
Q1:我只有 3 GB 显存,豆包卡怎么办?
A:豆包为云端算力,显存无要求;本地跑 SDXL 的小伙伴可把分辨率降到 512×768,再靠“放大插件”二次超清。
Q2:提示词里中/英文混用可以吗?
A:可,但双语长句易让模型歧义。建议主体英+细节中,或全英文。用一句中文补充“东方神话气质”即可。
Q3:多轮对话究竟要迭代多少轮?
A:通常 6–10 轮可达电商级商用。个人练习不必追求 100%,主视觉 OK 即可快走下一步。
Q4:AI 视频出现人物脸歪如何修?
A:在即梦“面部增强”打开,若仍有瑕疵,出片后用 Replicate 的 face-restoration 模型跑 1 秒补帧,配合关键帧蒙版。
Q5:版权风险怎么规避?
A:确认训练数据集为开源或 CC0;商用请购买生成平台商用版权包,或自行训练 LoRA,避免潜在侵权。
场景迁移:同一套流程还能做什么?
复制整节流程,只需替换极少量关键词即可复刻:
- 赛博武士 → 车尾灯、湿滑街面、霓虹蓝紫色光。
- 西部女枪手 → 黄沙、午后顶光、左轮特写、弹壳慢动作。
- 国风水墨龙 → 泼墨背景、青绿 RGB 分离、墨迹扩散转场。
👉 把今天的神作一键升级成商用级短片:选对模型、勤做记录、持续抽卡,是提高 AI 生产力最稳的三板斧。
关键词总结
AI复刻、提示词工程、豆包生图、多轮对话、抽卡微调、Gemini反推、电影感短片、竖屏9:16、狩猎女神、AIGC视频
收藏本文并实操一遍,你就能跳出“只会复制粘贴”的圈子,把任何参考图变成个人风格的 10 秒爆款。