feat: polish generation demo workflow

2026-04-18 14:06:38 +08:00
parent 5d8fb1ed50
commit 0f260f649c
15 changed files with 569 additions and 74 deletions
--- a/docs/planning/demo-checklist.md
+++ b/docs/planning/demo-checklist.md
@@ -57,6 +57,7 @@ SMOKE_AUDIO=1 ./scripts/demo_smoke.sh
 - [ ] 绘本图片 retry 后 `image_status=ready`
 - [ ] `/admin/providers/capabilities` 返回 `text/image/tts/storybook`
 - [ ] 如果启用 `SMOKE_AUDIO=1`，音频 retry 后 `audio_status=ready`
+- [ ] 验证结果已记录到 `docs/planning/demo-validation-log.md`

 ---

@@ -100,6 +101,8 @@ SMOKE_AUDIO=1 ./scripts/demo_smoke.sh

 ## 4. 3 分钟讲解结构

+详细稿见 `docs/planning/interview-pitch.md`。现场建议背结构，不逐字背。
+
 ### 0:00 - 0:40 产品定位

 DreamWeaver 是面向 3-8 岁亲子场景的个性化 AI 绘本与陪伴式讲述产品。它不是只生成一次性故事，而是围绕孩子档案、成长主题和故事宇宙，生成可回看、可补全、可聆听的故事体验。
--- a/docs/planning/demo-validation-log.md
+++ b/docs/planning/demo-validation-log.md
@@ -0,0 +1,54 @@
+# Demo 验证记录
+
+这份记录用于演示前快速说明“当前本地 Docker 环境已经验证到什么程度”。新的验证记录按时间倒序追加。
+
+## 2026-04-18
+
+验证范围：
+
+- 用户前端 Docker 生产构建
+- 管理前端 Docker 生产构建
+- 后端 Docker 镜像构建与服务重启
+- 后端 lint 与测试
+- 后端统一生成接口
+- 故事封面资产补全
+- 故事音频资产补全
+- 绘本文字生成
+- 绘本封面和分页插图补全
+- 故事列表读取
+- Provider capability policy
+
+执行命令：
+
+```bash
+docker compose build frontend
+docker compose build frontend frontend-admin
+docker compose build backend backend-admin worker celery-beat
+docker compose up -d backend backend-admin worker celery-beat frontend frontend-admin
+cd backend && .venv/bin/python -m ruff check app tests
+cd backend && .venv/bin/python -m pytest -q
+SMOKE_AUDIO=1 ./scripts/demo_smoke.sh
+```
+
+结果：
+
+- `vue-tsc` 通过。
+- 用户端与管理端 `vite build` 通过。
+- Docker 前端镜像 `dreamweaver-frontend:dev` 构建通过。
+- Docker 管理前端镜像 `dreamweaver-admin-frontend:dev` 构建通过。
+- Docker 后端镜像 `dreamweaver-backend:dev` 构建通过。
+- `ruff check app tests` 通过。
+- `pytest -q` 通过，71 个测试通过。
+- `SMOKE_AUDIO=1 ./scripts/demo_smoke.sh` 通过。
+- 本地用户端可通过 `http://localhost:52080` 访问。
+
+已确认的演示能力：
+
+- 普通故事可以先生成可读正文。
+- 封面和音频可以作为资产单独重试。
+- 绘本可以生成 6 页文本并补全全部插图。
+- 故事列表能看到最新生成结果。
+
+限制：
+
+- 本机浏览器自动化脚本默认寻找标准版 Chrome；当前电脑安装的是 Google Chrome Beta，所以本轮没有生成 CDP 截图。
--- a/docs/planning/interview-pitch.md
+++ b/docs/planning/interview-pitch.md
@@ -0,0 +1,83 @@
+# DreamWeaver 3 分钟项目讲解稿
+
+这份讲解稿用于 AI 产品经理面试中的项目介绍。建议先背结构，不要逐字背稿；现场根据面试官背景调整技术深度。
+
+---
+
+## 0:00 - 0:30 一句话定位
+
+DreamWeaver 是一款面向 3-8 岁亲子场景的个性化 AI 绘本与陪伴式讲述产品。它不是简单生成一段故事，而是围绕孩子档案、成长主题和故事宇宙，生成可以保存、回看、补全封面和播放语音的亲子阅读体验。
+
+---
+
+## 0:30 - 1:05 为什么要重启这个项目
+
+这个项目早期功能很多：故事生成、绘本、语音、Provider 管理、孩子档案、记忆系统都做过，但主线不够聚焦。求职版重启时，我把目标从“功能越多越好”改成“能否讲清楚一个 AI 产品闭环”。
+
+我保留的核心闭环是：
+
+`选择孩子档案 -> 输入主题/教育目标 -> 生成故事或绘本 -> 补全封面/插图/语音 -> 保存到故事库 -> 可再次打开`
+
+这样面试官能快速理解用户价值，也能看到我对范围收敛的判断。
+
+---
+
+## 1:05 - 1:55 统一生成工作流
+
+AI 生成产品最大的问题不是“能不能调模型”，而是结果不确定时，用户体验怎么保持稳定。所以我把普通故事、完整故事和绘本生成收敛成统一 Generation Workflow。
+
+现在系统先保存主结果，让故事或绘本文字尽快可读；封面、绘本插图和语音作为可补全资产处理。即使图片或音频失败，主故事不会丢，用户可以继续阅读，也可以稍后重试。
+
+后端通过统一状态字段表达结果：
+
+- `generation_status`
+- `image_status`
+- `audio_status`
+- `last_error`
+
+服务层也抽出了 `AssetCompletionResult`，用来表达资产补全类型、状态、结果值、错误信息和是否阻塞主结果。
+
+---
+
+## 1:55 - 2:35 Provider 分层
+
+另一个重点是 Provider 体系。早期 Provider Router 同时承担默认配置、Key 映射、路由策略、熔断、成本统计和执行入口，解释起来很乱。
+
+我把它拆成四个概念：
+
+- Capability：产品需要的 AI 能力，例如文本、图片、语音、绘本结构
+- Provider：某个能力下的供应商配置，例如 Gemini、OpenAI、CQTAI、MiniMax
+- Adapter：具体 API 调用实现
+- Routing Policy：如何按优先级、成本、延迟或轮询选择 Provider
+
+这样用户看到的是稳定的产品能力，系统内部再决定具体调用哪个模型或供应商。
+
+---
+
+## 2:35 - 3:00 当前成果和下一步
+
+目前本地 Docker 可以跑通完整链路，并且有 smoke 脚本验证健康检查、登录、生成、资产重试、故事列表和 Provider 能力分层。
+
+下一步我会继续打磨前端状态体验，让生成中、部分完成、失败重试这些 AI 产品特有状态更清楚；同时明确旧 API 兼容层和 generation job 是否需要落库。
+
+我希望通过这个项目展示的是：我不只是会接 AI API，而是能把不确定的模型能力收敛成稳定、可解释、可恢复的产品体验。
+
+---
+
+## 面试官追问时的简短回答
+
+### 为什么不是继续加更多功能？
+
+因为求职版的核心目标是展示产品判断和系统设计能力。功能越多不一定越好，闭环稳定、边界清楚、能解释取舍更重要。
+
+### 为什么资产失败不直接让生成失败？
+
+儿童故事的主价值是可阅读内容。封面、插图、语音是增强资产，失败时应该降级而不是摧毁主结果。这是 AI 产品常见的不确定性处理。
+
+### Provider 分层有什么产品价值？
+
+它让用户不需要理解模型供应链，只感知稳定能力；同时让产品拥有者能控制成本、失败降级和供应商切换。
+
+### 这个项目下一步怎么上线？
+
+我会先完成演示级前端状态体验和旧 API 兼容策略，再决定 generation job 是否落库。生产上线前还需要补真实用户鉴权配置、密钥管理、监控告警和部署策略。
--- a/docs/planning/week-2-execution-backlog.md
+++ b/docs/planning/week-2-execution-backlog.md
@@ -76,13 +76,13 @@ Week 2 的目标不是做“完整商业产品”，而是做出一个面试时
 | W2-01 | Demo | 固化本地 Docker smoke 脚本 | `scripts/demo_smoke.sh` | P0 | 0.5d | Done |
 | W2-02 | Demo | 形成求职演示 checklist | `docs/planning/demo-checklist.md` | P0 | 0.5d | Done |
 | W2-03 | Planning | 输出 Week 2 执行 backlog | 当前文档 | P0 | 0.5d | Done |
-| W2-04 | Product | 写 3 分钟项目讲解稿 | 面试口径：产品、工作流、Provider、取舍 | P0 | 0.5d | Pending |
-| W2-05 | Frontend | 打磨创建弹窗的状态文案 | 用户知道正在生成故事/绘本/资产 | P0 | 0.5d | Pending |
-| W2-06 | Frontend | 强化故事详情页资产状态与重试 CTA | 图片/音频失败时可理解、可操作 | P0 | 1.0d | Pending |
-| W2-07 | Frontend | 强化绘本阅读器降级态 | 缺图、失败、加载中不出现空白体验 | P0 | 1.0d | Pending |
-| W2-08 | Backend | 梳理旧生成 API 兼容层策略 | 保留/标记 deprecated/迁移计划 | P1 | 0.5d | Pending |
-| W2-09 | Backend | 判断 generation job 是否需要落库 | ADR 或技术说明 | P1 | 0.5d | Pending |
-| W2-10 | QA | 补前端关键路径构建与 smoke 验证记录 | Docker build + smoke 输出 | P1 | 0.5d | Pending |
+| W2-04 | Product | 写 3 分钟项目讲解稿 | 面试口径：产品、工作流、Provider、取舍 | P0 | 0.5d | Done |
+| W2-05 | Frontend | 打磨创建弹窗的状态文案 | 用户知道正在生成故事/绘本/资产 | P0 | 0.5d | Done |
+| W2-06 | Frontend | 强化故事详情页资产状态与重试 CTA | 图片/音频失败时可理解、可操作 | P0 | 1.0d | Done |
+| W2-07 | Frontend | 强化绘本阅读器降级态 | 缺图、失败、加载中不出现空白体验 | P0 | 1.0d | Done |
+| W2-08 | Backend | 梳理旧生成 API 兼容层策略 | 保留/标记 deprecated/迁移计划 | P1 | 0.5d | Done |
+| W2-09 | Backend | 判断 generation job 是否需要落库 | ADR 或技术说明 | P1 | 0.5d | Done |
+| W2-10 | QA | 补前端关键路径构建与 smoke 验证记录 | Docker build + smoke 输出 | P1 | 0.5d | Done |
 | W2-11 | Docs | 输出 Week 1 Sprint Review | `docs/planning/week-1-sprint-review.md` | P1 | 0.5d | Done |
 | W2-12 | Docs | 更新 README 的演示前检查流程 | README 本地演示说明 | P1 | 0.5d | Done |