feat: add generation job cancel and retry queue
This commit is contained in:
@@ -126,7 +126,7 @@ DreamWeaver 是面向 3-8 岁亲子场景的个性化 AI 绘本与陪伴式讲
|
||||
|
||||
### 2:20 - 3:00 取舍与下一步
|
||||
|
||||
求职版优先稳定闭环和可解释性,不做支付、多租户和复杂监控。现在 job/event 已能查询 workflow、资产补全、provider 调用轨迹和聚合指标,用户端和管理端也能展示生成轨迹与跨故事 Provider 运营摘要;下一步会迁移到后台 worker。
|
||||
求职版优先稳定闭环和可解释性,不做支付、多租户和复杂监控。现在 job/event 已能查询 workflow、资产补全、provider 调用轨迹和聚合指标,用户端和管理端也能展示生成轨迹与跨故事 Provider 运营摘要;统一生成也已经迁移到后台 worker,下一步是补取消/重试队列。
|
||||
|
||||
---
|
||||
|
||||
|
||||
@@ -51,7 +51,7 @@ SMOKE_AUDIO=1 ./scripts/demo_smoke.sh
|
||||
- **AI 不确定性处理**:主内容和资产拆开,图片/音频失败不阻塞阅读。
|
||||
- **Provider 产品化**:用户看到稳定能力,系统内部用 Capability / Provider / Adapter / Routing Policy 管供应链。
|
||||
- **可观测性**:generation job/event 让生成过程、失败恢复和 Provider 成本可解释。
|
||||
- **可继续生产化**:前端已有轮询形态,后端已有任务事件模型,下一步可以迁移到 worker。
|
||||
- **可继续生产化**:统一生成已经迁移到 worker,前端轮询和任务事件模型也已打通,下一步是补取消/重试队列和更完整监控。
|
||||
|
||||
---
|
||||
|
||||
@@ -63,4 +63,4 @@ SMOKE_AUDIO=1 ./scripts/demo_smoke.sh
|
||||
| 图片生成失败 | 展示 `degraded_completed` 与资源重试 |
|
||||
| Docker 冷启动慢 | 演示前先跑 smoke 并保持容器运行 |
|
||||
| Provider 追问过深 | 回到 Capability / Provider / Adapter / Routing Policy 四层解释 |
|
||||
| 生产化追问 | 说明下一步是 worker 化、监控告警、密钥治理和 Provider analytics 扩展 |
|
||||
| 生产化追问 | 说明下一步是取消/重试队列、监控告警、密钥治理和 Provider analytics 扩展 |
|
||||
|
||||
@@ -83,4 +83,4 @@ AI 生成产品最大的问题不是“能不能调模型”,而是结果不
|
||||
|
||||
### 这个项目下一步怎么上线?
|
||||
|
||||
我会先把当前轻量 job/event 模型迁移到后台 worker 和进度轮询,再补跨时间窗口的 provider 运营分析。生产上线前还需要补真实用户鉴权配置、密钥管理、监控告警和部署策略。
|
||||
我已经把当前轻量 job/event 模型迁移到后台 worker,并打通了前端进度轮询;下一步会补取消/重试队列,再继续扩展跨时间窗口和跨用户维度的 provider 运营分析。生产上线前还需要补真实用户鉴权配置、密钥管理、监控告警和部署策略。
|
||||
|
||||
@@ -71,6 +71,7 @@ Week 2 已完成演示闭环、统一生成工作流、generation job/event、
|
||||
| W4-08 | Ops | 任务运行概览与失败摘要 | `GET /api/generations/ops-summary` + 最近失败列表 | P1 | Done |
|
||||
| W4-09 | Workflow | 卡住任务自动收敛 | `GENERATION_JOB_STALE_MINUTES` + Celery beat stale job maintenance | P1 | Done |
|
||||
| W4-10 | Workflow | 防止重复资产任务 | 运行中故事拒绝重复封面/音频/资产重试请求 | P1 | Done |
|
||||
| W4-11 | Workflow | 生成任务取消与重新排队 | 取消已提交任务,失败/取消任务可重新排队 | P1 | Done |
|
||||
|
||||
---
|
||||
|
||||
|
||||
@@ -18,6 +18,11 @@
|
||||
- 时间线能展示阅读记录与记忆沉淀
|
||||
- Week 4 已补齐绘本阅读位置恢复。
|
||||
- Week 4 已输出架构说明和 Demo 包装文档。
|
||||
- 生产化主线已继续推进:
|
||||
- `POST /api/generations` 已迁移到后台 worker
|
||||
- 创建弹窗会先拿到 `generation_job_id`,再轮询主记录落库
|
||||
- 统一生成链路的 smoke、测试和前端构建已跟进到异步语义
|
||||
- 首版取消/重试队列已落地,支持取消已提交任务和从失败/取消任务重新排队
|
||||
|
||||
---
|
||||
|
||||
@@ -43,7 +48,7 @@ DreamWeaver 已经具备求职演示所需的完整闭环:
|
||||
|
||||
最近一轮验证包括:
|
||||
|
||||
- 后端全量测试:91 passed
|
||||
- 后端全量测试:94 passed
|
||||
- 后端 ruff:通过
|
||||
- 用户端生产构建:通过
|
||||
- 管理端生产构建:通过
|
||||
@@ -56,10 +61,9 @@ DreamWeaver 已经具备求职演示所需的完整闭环:
|
||||
|
||||
| Priority | Task | Why |
|
||||
| --- | --- | --- |
|
||||
| P0 | 将同步生成迁移到 Celery worker | 支持真实长任务、断点恢复和后台进度 |
|
||||
| P1 | 生成任务取消与重试队列 | 防止重复任务和用户误触造成浪费 |
|
||||
| P1 | 跨用户 / 跨环境 Provider dashboard | 当前已支持单用户摘要,后续要支持运营视角 |
|
||||
| P0 | 跨用户 / 跨环境 Provider dashboard | 当前已支持单用户摘要,后续要支持运营视角 |
|
||||
| P1 | 监控告警与结构化 dashboard | 目前已有故事库级概览,后续要接入更完整观测体系 |
|
||||
| P1 | 断点续跑与更细粒度任务控制 | 让取消、重试和 worker 恢复更稳 |
|
||||
| P2 | 更细粒度叙事风格与音色策略 | 扩展体验,但不影响当前求职版主线 |
|
||||
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user