背景
当前图片/视频/文案生成与博客流程强耦合,无法独立使用。缺少音频生成(TTS)和统一的素材管理中心。
目标
将生成能力解耦为独立的 AssetGeneratorService,支持文案/图片/视频/音频独立生成,新增素材库管理页面。
方案概要(详见 115.00.素材生成方案.md)
核心架构
素材生成请求 → AssetGeneratorService
├── TextGenerator(复用 WriterAgent)
├── ImageGenerator(复用 ArtistAgent)
├── VideoGenerator(复用 VideoService)
├── AudioGenerator(新增 TTS)
└── CodeGenerator(复用 CoderAgent)
→ AssetStorage(统一存储 + 元数据)
关键模块
- Asset 模型:统一素材实体(type/title/content/url/metadata/tags)
- 各类 Generator:从现有 Agent 抽离,支持独立调用
- AudioGenerator(新增):TTS 集成,支持 OpenAI TTS / Edge TTS / Fish Audio / MiniMax TTS
- 素材库 AssetLibrary.vue:分类浏览、搜索、批量操作
API
POST /api/assets/generate # 生成素材
GET /api/assets # 素材列表
GET /api/assets/search?q=xxx # 搜索
POST /api/assets/batch/generate # 批量生成
实现路径
| 阶段 |
内容 |
工作量 |
| P1 |
Asset 模型 + SQLite 持久化 |
1d |
| P2 |
抽离 Text/Image/Video Generator |
3d |
| P3 |
新增 AudioGenerator(TTS) |
2d |
| P4 |
API + 前端素材库页面 |
3d |
| P5 |
批量生成 + 工作流 Action 集成 |
2d |
可行性
高。图片/视频/文案生成能力已有,核心是解耦 + 统一 Asset 模型 + 新增 TTS。