01BeePop Slot Lab

OpenDesign v0.1

从 Prompt 到可验收生图工作流

BeePop Slot Lab 的研发演进：把一个 AI 生图套路做成可测试、可复盘、可迭代的工程实验室。

Image A/B产品身份与使用逻辑分权

TestCase批量验证而非单张 demo

Report产物、字段、反馈可追溯

02BeePop Slot Lab

Why

不是为了多生成一张图

业务要的是稳定套路，不是一次性 demo。
研发要能批量跑 TestCase、复盘失败、沉淀改进证据。
验收要看到输入、Prompt、模式字段、图片产物和人工反馈。

03BeePop Slot Lab

Business Context

Amazon 产品场景图的真实难点

白底产品图通常缺少真实使用逻辑。
竞品场景图有参考价值，但容易污染结构、颜色、构图和品牌表达。
复杂产品会在挂点、支撑、负载、遮挡、方向上穿帮。
所以需要 workflow 层面的参考图权威治理。

04BeePop Slot Lab

Reference Product Scene

核心输入：Image A + Image B

Image A

产品身份权威：结构、颜色、组件数量、功能锚点。

Image B

使用逻辑参考：场景、互动、接触、负载、自然遮挡。

Product Text

最小产品信息，不拼进图生图 Prompt。

Output Contract

结构化输出和报告字段解析依据。

05BeePop Slot Lab

Governance

Image A / Image B 的非对称权威

Image A defines identity.
Image B informs usage.
Image B 只借“怎么用”，不借“长什么样”和“怎么摆”。
两图冲突时，产品身份、结构、颜色、功能锚点都以 Image A 为准。

一句话：把 Image B 当使用逻辑样本，不当产品蓝图。

06BeePop Slot Lab

Mode Routing

三种生成模式

Mode A

锁定 Image A 姿态，围绕产品重建场景。

Mode B

Image B 只作为通过审计的 usage-slot pose proxy。

Mode C

低互动语境场景，避免强行复杂互动。

Not Applicable

无法安全建立可信使用语境时停止生成。

07BeePop Slot Lab

Main Agent

主 Agent 的 6 步分析链

1 权威设定

Image A / Image B 的角色边界。

2 产品锚点

Image A 身份、姿态、功能锚点。

3 使用槽位

Image B 互动、接触、负载、遮挡。

4 模式决策

D1-D4、Mode Gates、Routing。

5 场景计划

可见性、遮挡、环境、重构策略。

6 Final Prompt

把审计结果转成图生图指令。

08BeePop Slot Lab

TestCase

为什么必须批量 TestCase

单张 demo 会隐藏模式路由和污染风险。
同一个 Image A 配不同 Image B，会产生不同迁移压力。
must_preserve / should_transfer / must_avoid 让验收语义固定下来。
报告把 case 输入、过程、输出、warnings 和人工反馈串起来。

09BeePop Slot Lab

Phase 1-4

先搭 Slot Lab 骨架

Phase 1

项目本地 Skill MVP、slot skeleton、schema。

Phase 2

真实 full-chain execution：主 Agent + 图生图。

Phase 3

TestCase intake、生命周期、歧义门禁。

Phase 4

HTML report、YAML eval、failure aggregation。

10BeePop Slot Lab

Phase 5

第一个真实 Slot 落地

reference-product-scene 成为真实可跑 workflow。
主 Agent Prompt 升级为证据驱动 Mode Routing。
Review Board 展示 Image A / Image B / Generated 三图对比。
6 case live smoke 验证 prompt、图片、metadata、report、user eval。

11BeePop Slot Lab

Phase 5 Lesson

不是“有图”就算成功

Prompt 正确

必须使用最新 main_agent_prompt.md。

输入正确

主 Agent 和图生图都要有 Image A + Image B。

产物对应

Generated image 不能串 case。

字段可读

Selected Mode / Contract / Recomposition 不能 unknown。

12BeePop Slot Lab

Phase 6

Live Smoke Iteration System

6.1 Runner

prepare / execute / audit / render。

6.2 Provider

llm_provider 加速主 Agent 和图生图验证。

6.3 Report UI

摘要卡、drawer、lightbox、关键字段。

6.4-6.6

artifact normalization、Frontend V2、feedback capture。

13BeePop Slot Lab

Transports

Codex Native / llm_provider / Replicate

Codex Native：贴近当前 Codex 工作流和 image_gen 能力。
llm_provider：更接近生产 API，可指定模型并提升并发。
Replicate：验证 provider-style image input contract。
共同契约：clean context + Image A/B provenance + canonical artifacts。

14BeePop Slot Lab

Report UI

报告从验产物升级为辅助迭代

15BeePop Slot Lab

Report Details

详情侧栏和 Lightbox 提升验收效率

16BeePop Slot Lab

Phase 7

Operator Experience & Throughput

7.1 Concurrent Runner

多 Case / 多 Step / 多 transport bounded concurrency。

7.2 Run Operations

rerun failed、rerun selected、repeat last、recovery。

7.3 Progressive Visibility

运行中逐步看到 pending / running / succeeded / failed。

17BeePop Slot Lab

Case Demo 1

TC-RPS-0001：三折衣架

18BeePop Slot Lab

Case Demo 2

TC-RPS-0010：老人护理搬运带

19BeePop Slot Lab

Case Demo 3

TC-RPS-0020：高遮挡使用参考

20BeePop Slot Lab

Pitfalls

研发中踩过的坑

旧 Prompt

跑 case 时没用最新 main_agent_prompt.md。

漏 Image B

主 Agent 或图生图 step 漏传使用参考图。

Prompt 污染

metadata / case yaml / output contract 拼进 provider prompt。

图片串 case

并发下扫描 generated_images 会绑定错输出。

21BeePop Slot Lab

Best Practices

当前最佳实践

主 Agent 和图生图都必须显式使用 Image A + Image B。
Final Prompt 是 provider prompt，其他信息默认 metadata-only。
关键字段先 deterministic parser，AI judge 后置增强。
报告首页只放决策字段和视觉结果，细节进入 drawer / lightbox。
live smoke 同时验证功能、产物关系和输入契约。

22BeePop Slot Lab

What We Built

这个项目真正沉淀了什么

Prompt 工程方法

权威边界、证据驱动模式路由、guardrails。

AI Workflow 测试

TestCase、live smoke、artifact audit、recovery。

验收报告系统

三图对比、关键字段、warnings、feedback bundle。

多 Transport 抽象

Codex native、llm_provider、Replicate 共用契约。

Human-in-the-loop

人工 verdict 和 problem areas 回流迭代。

并发化基础

提升全量 smoke 吞吐，同时避免产物串 case。

23BeePop Slot Lab

Roadmap

后续方向

Phase 7.3：Progressive Run Visibility。
Phase 7 UX Design Pass：用 Figma / Pencil 做高保真交互设计。
Phase 8：AI Review、Vision Quality Judge、Skill Extraction Decision。
Backlog：Report Publish Bundle、Cloud Report Deployment、更多真实 Slot。

24BeePop Slot Lab

Closing

核心观点

BeePop Slot Lab workflow infographic — BeePop Slot Lab：从 Prompt 到可验收生图工作流

AI 生图能力本身不是交付物，稳定 workflow 才是。

用户保留判断和反馈，Agent 承接执行、测试和复盘。

每一次 live smoke 都要能反向推动 prompt / workflow 迭代。