01BeePop Slot Lab

OpenDesign v0.1

从 Prompt 到可验收生图工作流

BeePop Slot Lab 的研发演进:把一个 AI 生图套路做成可测试、可复盘、可迭代的工程实验室。

Image A/B产品身份与使用逻辑分权
TestCase批量验证而非单张 demo
Report产物、字段、反馈可追溯
02BeePop Slot Lab

Why

不是为了多生成一张图

03BeePop Slot Lab

Business Context

Amazon 产品场景图的真实难点

04BeePop Slot Lab

Reference Product Scene

核心输入:Image A + Image B

Image A

产品身份权威:结构、颜色、组件数量、功能锚点。

Image B

使用逻辑参考:场景、互动、接触、负载、自然遮挡。

Product Text

最小产品信息,不拼进图生图 Prompt。

Output Contract

结构化输出和报告字段解析依据。

05BeePop Slot Lab

Governance

Image A / Image B 的非对称权威

一句话:把 Image B 当使用逻辑样本,不当产品蓝图。
06BeePop Slot Lab

Mode Routing

三种生成模式

Mode A

锁定 Image A 姿态,围绕产品重建场景。

Mode B

Image B 只作为通过审计的 usage-slot pose proxy。

Mode C

低互动语境场景,避免强行复杂互动。

Not Applicable

无法安全建立可信使用语境时停止生成。

07BeePop Slot Lab

Main Agent

主 Agent 的 6 步分析链

1 权威设定

Image A / Image B 的角色边界。

2 产品锚点

Image A 身份、姿态、功能锚点。

3 使用槽位

Image B 互动、接触、负载、遮挡。

4 模式决策

D1-D4、Mode Gates、Routing。

5 场景计划

可见性、遮挡、环境、重构策略。

6 Final Prompt

把审计结果转成图生图指令。

08BeePop Slot Lab

TestCase

为什么必须批量 TestCase

09BeePop Slot Lab

Phase 1-4

先搭 Slot Lab 骨架

Phase 1

项目本地 Skill MVP、slot skeleton、schema。

Phase 2

真实 full-chain execution:主 Agent + 图生图。

Phase 3

TestCase intake、生命周期、歧义门禁。

Phase 4

HTML report、YAML eval、failure aggregation。

10BeePop Slot Lab

Phase 5

第一个真实 Slot 落地

11BeePop Slot Lab

Phase 5 Lesson

不是“有图”就算成功

Prompt 正确

必须使用最新 main_agent_prompt.md。

输入正确

主 Agent 和图生图都要有 Image A + Image B。

产物对应

Generated image 不能串 case。

字段可读

Selected Mode / Contract / Recomposition 不能 unknown。

12BeePop Slot Lab

Phase 6

Live Smoke Iteration System

6.1 Runner

prepare / execute / audit / render。

6.2 Provider

llm_provider 加速主 Agent 和图生图验证。

6.3 Report UI

摘要卡、drawer、lightbox、关键字段。

6.4-6.6

artifact normalization、Frontend V2、feedback capture。

13BeePop Slot Lab

Transports

Codex Native / llm_provider / Replicate

14BeePop Slot Lab

Report UI

报告从验产物升级为辅助迭代

Report 首页:摘要卡、状态、关键字段、视觉结果入口
Report 首页:摘要卡、状态、关键字段、视觉结果入口
15BeePop Slot Lab

Report Details

详情侧栏和 Lightbox 提升验收效率

Generation details
Generation details
Input / Generated compare
Input / Generated compare
Human review
Human review
16BeePop Slot Lab

Phase 7

Operator Experience & Throughput

7.1 Concurrent Runner

多 Case / 多 Step / 多 transport bounded concurrency。

7.2 Run Operations

rerun failed、rerun selected、repeat last、recovery。

7.3 Progressive Visibility

运行中逐步看到 pending / running / succeeded / failed。

17BeePop Slot Lab

Case Demo 1

TC-RPS-0001:三折衣架

Image A: 产品身份权威
Image A: 产品身份权威
Image B: 使用逻辑参考
Image B: 使用逻辑参考
Generated: Amazon-style scene
Generated: Amazon-style scene
18BeePop Slot Lab

Case Demo 2

TC-RPS-0010:老人护理搬运带

Image A: 蓝色护理搬运带
Image A: 蓝色护理搬运带
Image B: 护理转移动作参考
Image B: 护理转移动作参考
Generated: 人体互动高风险 case
Generated: 人体互动高风险 case
19BeePop Slot Lab

Case Demo 3

TC-RPS-0020:高遮挡使用参考

Image A: 产品结构锚点
Image A: 产品结构锚点
Image B: 使用槽位和遮挡参考
Image B: 使用槽位和遮挡参考
Generated: 需人工确认一致性
Generated: 需人工确认一致性
20BeePop Slot Lab

Pitfalls

研发中踩过的坑

旧 Prompt

跑 case 时没用最新 main_agent_prompt.md。

漏 Image B

主 Agent 或图生图 step 漏传使用参考图。

Prompt 污染

metadata / case yaml / output contract 拼进 provider prompt。

图片串 case

并发下扫描 generated_images 会绑定错输出。

21BeePop Slot Lab

Best Practices

当前最佳实践

22BeePop Slot Lab

What We Built

这个项目真正沉淀了什么

Prompt 工程方法

权威边界、证据驱动模式路由、guardrails。

AI Workflow 测试

TestCase、live smoke、artifact audit、recovery。

验收报告系统

三图对比、关键字段、warnings、feedback bundle。

多 Transport 抽象

Codex native、llm_provider、Replicate 共用契约。

Human-in-the-loop

人工 verdict 和 problem areas 回流迭代。

并发化基础

提升全量 smoke 吞吐,同时避免产物串 case。

23BeePop Slot Lab

Roadmap

后续方向

24BeePop Slot Lab

Closing

核心观点

BeePop Slot Lab workflow infographic
BeePop Slot Lab:从 Prompt 到可验收生图工作流
AI 生图能力本身不是交付物,稳定 workflow 才是。
用户保留判断和反馈,Agent 承接执行、测试和复盘。
每一次 live smoke 都要能反向推动 prompt / workflow 迭代。
Use horizontal scroll / trackpad / arrow keys