一条把中保真交互线稿自动推导为高保真 UI 视觉成品的工程化管线。 核心方法 Hybrid Pipeline:AI 负责角色资产生成,代码负责结构与视觉骨架——让每一段做自己擅长的事。 本页以一次真实的抽卡页面为样例,完整记录 6 次生成、3 次转向的试错与诊断。
沿用 skill-3000-video-outfit 的方法论:线框控结构 + 风格控外观。本次关键修正——角色身份应从视觉稿提取,线框仅负责布局结构。
每一次失败都暴露出一个关于 Gemini / Banana 模型的新认知。真正的价值不在测试通过的那张稿件,而在这些积累下来的 Prompt 工程与架构决策。
测试通过的稿件严格遵守线框定义的 8 Zone 结构,同时在视觉上完全继承 Y2K 霓虹风格。结构不变,外观升级。
让每一段做自己擅长的事 · 代码保精准 + AI 补插画
从这次迭代中提炼出来的通用原则 · 下一个 UI 场景可直接套用
线框只控结构,视觉稿只控外观和角色身份。不要让一张图同时承担布局和风格,会让 AI 混淆。
Gemini / Banana 是模板匹配思维,不真正理解 UI 结构。给它生角色 / 生背景,别让它生 UI 骨架。
做角色参考时,参考图里不能含 UI chrome。Banana 会直接复制参考图里的整体 UI,文字禁止无法拦截。
Design Token + CSS 变量组合,文字 100% 可控 · 布局精准 · 修改秒级响应。这才是 UI 生产流水线该有的样子。
3000 Comfyui 实例偶尔不可用,rembg + U²-Net 本地跑更稳定,透明 PNG 直接进 CSS 合成。
每次失败都诊断出一条关于模型行为的新认知。这些认知比成品更有价值——它们决定下次能否一次到位。
把鼠标挪过去感受粒子磁场。参数沿用你给的 preset:600 颗方粒 · #c186cd 紫 · 磁吸半径 23 · 波浪幅度 1.5 · 深度因子 3.5。