将参考与角色设计归档至文件夹,由 WorkBuddy 自动完成全链路匹配与批量生成
从重复劳动中释放创作力,让美术团队回归创意决策核心
美术只需准备两组素材放入指定文件夹,WorkBuddy 自动完成匹配、生成、筛选全流程
文字 / 图片 / 视频
任意组合放入即可
自动解析提取
角色正 / 背面图
多套服装可选
外观基准锁定
Gemini img2img
逐张逐帧批量处理
多角色并行
N × M 张可选图
一致性保障
创意决策空间
恐龙橘猫
小鸡加菲
西装缅因
以跳舞猫咪换装为例,验证管线在视频场景下的动作保真能力 — 左侧原始帧 | 右侧 AI 换装输出,姿态完全一致






N 个角色 × M 张参考图 → 全量输出保持外观统一、位置稳定、风格一致
Prompt硬编码左中右固定站位 + camerafixed:true 防漂移
左边=小鸡加菲,中间=恐龙橘猫(领舞),右边=西装缅因。左-中-右固定站位。
同一组角色正/反面图作为 reference_image 贯穿全部帧生成和视频合成
Phase 1 纯画面生成(绕过审核)→ Phase 2 ffmpeg -shortest 混入音频自动对齐
不合格帧单独回炉重绘,不影响已完成帧。支持增量更新。
WorkBuddy Skill 封装的自动化管线,将逐张手工修图升级为 AI 并行批量产出
v1 → v6 六轮迭代总结的避坑指南
多张 reference_image + reference_audio 组合会触发「包含真人」误判导致失败
传数字 31 返回非 JSON 格式错误响应
v4 在第3秒处出现两个角色交换位置的 Bug
v1 尝试直接用三猫原始视频作为参考,Seedance 无法让三个角色同时保持各自独立的姿态和位置同步
参考视频 ≤15.2s;像素总数 ∈ [409,600, 927,408]
名义 10-20min,实际曾遇 60min 极端情况。标准版更稳定
v6 最终版完整跑通,参数均已在生产环境验证可用
| 模型 | doubao-seedance-2-0-fast-260128 |
| 任务 ID | cgt-20260421132733-b5frq |
| 镜头锁定 | 开启 ✓ |
| 角色阵容 | 🐤小鸡加菲(左) · 🦕恐龙橘猫(中·主舞) · 🎩西装缅因(右) |
| 音频 | 27s 原视频音轨(前 15s 截取) |
| 关键帧 | 40帧 → Gemini img2img 全量换装 → 40 张输出帧 |
| 交付 | seedance_v6_final.mp4 ✓ |
完整交付物 + 可复用 Skill 一键获取
从角色换装到 UI 界面生成 — 管线能力的下一步扩展方向
当前管线已实现角色外观一致性锁定。下一阶段目标:将同一方法论迁移至 UI/UX 界面设计领域——通过多组 UI 截图作为风格参考,结合低保真线框图, 由 AI 自动生成符合既定视觉规范的高保真界面设计稿。