# 技术设计文档:admin-web 后台重构优化 ## 概述 本次重构将 admin-web 从 18 个页面 / 11 个一级菜单重组为 7 个一级菜单模块,核心目标: 1. **菜单精简**:11 → 7 个一级菜单,按功能域聚合(ETL、触发器、AI 等) 2. **新增仪表盘**:登录后默认展示运行状态 Dashboard,聚合 OpsPanel + DB 健康 + AI 概览 3. **触发器统一管理**:聚合三套触发器数据源(biz.trigger_jobs / biz.ai_trigger_jobs / scheduled_tasks) 4. **新增后端 API**:PATCH /api/trigger-jobs/{id}/config(编辑触发器配置)、GET /api/admin/db-health(数据库健康)、GET /api/admin/triggers/unified(触发器统一列表) 5. **渐进式迁移**:新页面用目标路由开发,老页面测试通过后移入 `_archived/` ### 设计决策 - **Tab 视图而非子路由**:ETL 任务管理和触发器管理使用 Ant Design Tabs 组件 + URL 查询参数(`?tab=xxx`),而非嵌套路由。理由:Tab 切换不触发组件卸载,状态保持更自然。 - **复用而非重写**:Dashboard 通过 import 现有 OpsPanel / AIDashboard 组件的子模块实现聚合,不重写已有逻辑。 - **后端最小改动**:仅新增 3 个 API 端点,不修改现有业务逻辑。 ## 架构 ### 整体架构 ```mermaid graph TB subgraph "admin-web 前端" Router["React Router 7
路由层"] Layout["AppLayout
Sider + Content"] subgraph "7 个一级模块" Dashboard["运行状态
/dashboard"] ETL["ETL 任务管理
/etl-tasks"] MiniApp["小程序任务管理
/task-engine/*"] Triggers["触发器管理
/triggers"] Tenant["租户管理员
/tenant-admins"] Settings["系统设置
/settings"] Logs["日志调试
/logs/*"] end end subgraph "后端 API(FastAPI)" ExistingAPI["现有 API 端点"] NewPATCH["PATCH /api/trigger-jobs/{id}/config"] NewDBHealth["GET /api/admin/db-health"] NewUnified["GET /api/admin/triggers/unified"] end subgraph "数据库" TriggerJobs["biz.trigger_jobs"] AITriggerJobs["biz.ai_trigger_jobs"] ScheduledTasks["scheduled_tasks"] FourDBs["4 个数据库健康检测"] end Router --> Layout Layout --> Dashboard & ETL & MiniApp & Triggers & Tenant & Settings & Logs Dashboard --> ExistingAPI & NewDBHealth Triggers --> ExistingAPI & NewPATCH & NewUnified NewUnified --> TriggerJobs & AITriggerJobs & ScheduledTasks NewDBHealth --> FourDBs ``` ### 路由结构 ``` /login → Login(不变) /dashboard → Dashboard(新,默认首页) / → Redirect → /dashboard /etl-tasks?tab=config|manager|status → ETLTasks(新,合并 3 页面) /task-engine/trigger-jobs → TriggerJobs(移动路由) /task-engine/transfer-log → TransferLog(不变) /task-engine/pending-review → PendingReview(不变) /task-engine/config → TaskEngineConfig(不变) /triggers?tab=all|biz|ai|etl → TriggerManager(新) /tenant-admins → TenantAdmins(不变) /settings/env-config → EnvConfig(移动路由) /logs/dev-trace → DevTrace(移动路由) /logs/ai-run-logs → AIRunLogs(移动路由) /logs/db-viewer → DBViewer(移动路由) /log-viewer → Redirect → /etl-tasks?tab=manager ``` ### 菜单结构映射 | 序号 | 一级菜单 | 子项/Tab | 路由 | |------|----------|----------|------| | 1 | 运行状态 | — | /dashboard | | 2 | ETL 任务管理 | 任务配置 / 任务管理 / ETL 状态(Tab) | /etl-tasks?tab=config\|manager\|status | | 3 | 小程序任务管理 | 定时任务 / 转移日志 / 待审核任务 / 参数管理 | /task-engine/* | | 4 | 触发器管理 | 全部 / 业务 / AI / ETL(Tab) | /triggers?tab=all\|biz\|ai\|etl | | 5 | 租户管理员 | — | /tenant-admins | | 6 | 系统设置 | 环境配置 / 触发器配置(跳转) | /settings/* | | 7 | 日志调试 | DevTrace / AI 调用明细 / 数据库查看器 | /logs/* | ## 组件与接口 ### 新增前端页面组件 #### 1. Dashboard(运行状态仪表盘) ``` src/pages/Dashboard.tsx ``` 聚合展示系统运行状况,由 4 个区块组成: - **OpsPanel 区块**:复用现有 OpsPanel 组件中的服务状态、Git 状态、系统资源子模块(需将 OpsPanel 拆分为可独立使用的子组件) - **DB 健康监控区块**:新组件 `DbHealthCard`,调用 `GET /api/admin/db-health`,展示 4 个数据库的连接池 / 大小 / 慢查询 - **AI 运行总览区块**:复用现有 AIDashboard 组件的统计卡片、趋势图、预算进度 - **AI 调度摘要区块**:展示今日触发数、成功率、最近错误,提供"查看详情"跳转到 `/triggers?tab=ai` 跳转链接: - "ETL 状态详情" → `/etl-tasks?tab=status` - "触发器详情" → `/triggers?tab=all` - "AI 调度详情" → `/triggers?tab=ai` #### 2. ETLTasks(ETL 任务管理) ``` src/pages/ETLTasks.tsx ``` 使用 Ant Design `Tabs` 组件合并 3 个现有页面: - Tab "config":渲染 ``(现有组件) - Tab "manager":渲染 ``(现有组件) - Tab "status":渲染 ``(现有组件) Tab 切换通过 URL 查询参数 `?tab=config|manager|status` 同步,支持浏览器前进/后退。使用 `useSearchParams` 读写当前 Tab。各 Tab 内容使用 `destroyInactiveTabPane={false}` 保持状态不丢失。 #### 3. TriggerManager(触发器统一管理) ``` src/pages/TriggerManager.tsx ``` 4 个 Tab: - **全部 Tab**(只读):调用 `GET /api/admin/triggers/unified`,展示统一字段表格(名称、类型标签、触发条件、状态、上次/下次执行、最近错误) - **业务 Tab**:复用现有 TriggerJobs 组件 + 新增编辑功能(调用 `PATCH /api/trigger-jobs/{id}/config`) - **AI Tab**:复用现有 AIOperations 组件的手动操作功能 + AITriggerJobs 的调度状态 - **ETL Tab**:展示 scheduled_tasks 数据(调用现有调度 API) #### 4. DbHealthCard(数据库健康卡片) ``` src/components/DbHealthCard.tsx ``` 独立组件,接收 `GET /api/admin/db-health` 返回数据,为每个数据库渲染一张卡片: - 连接池状态(活跃/空闲连接数,进度条) - 数据库大小(MB) - 慢查询数量(最近 1 小时) - 连接失败时显示"未连接"状态标签 ### 新增后端 API #### 1. PATCH /api/trigger-jobs/{id}/config ```python # apps/backend/app/routers/trigger_jobs.py 新增端点 @router.patch("/{job_id}/config", response_model=TriggerJobItem) async def update_trigger_config( job_id: int, body: UpdateTriggerConfigRequest, user: CurrentUser = Depends(get_current_user), ) -> TriggerJobItem: """编辑触发器的 cron_expression 或 interval_seconds。""" ``` 请求体 Schema: ```python class UpdateTriggerConfigRequest(BaseModel): cron_expression: str | None = None interval_seconds: int | None = None ``` 逻辑: 1. 查询 trigger_job 是否存在 2. 校验 cron_expression 格式(5 字段 cron 语法) 3. 校验 interval_seconds >= 1 4. 更新 trigger_config JSON 中对应字段 5. 调用 `_calculate_next_run()` 重新计算 next_run_at 6. 返回更新后的完整 trigger_job #### 2. GET /api/admin/db-health ```python # apps/backend/app/routers/admin_db_health.py 新增路由模块 @router.get("", response_model=list[DbHealthItem]) async def get_db_health( user: CurrentUser = Depends(get_current_user), ) -> list[DbHealthItem]: """返回 4 个数据库的健康状态。""" ``` 响应 Schema: ```python class DbHealthItem(BaseModel): db_name: str # etl_feiqiu / test_etl_feiqiu / zqyy_app / test_zqyy_app status: str # connected / disconnected active_connections: int | None = None idle_connections: int | None = None db_size_mb: float | None = None slow_query_count: int | None = None # 最近 1 小时内 > 1s 的查询数 ``` 逻辑: 1. 遍历 4 个数据库 DSN 配置 2. 对每个库尝试连接并执行诊断 SQL: - `pg_stat_activity` 查连接池状态 - `pg_database_size()` 查数据库大小 - `pg_stat_statements` 或 `pg_stat_activity` 查慢查询 3. 连接失败时返回 `status: "disconnected"`,其余字段为 null #### 3. GET /api/admin/triggers/unified ```python # apps/backend/app/routers/admin_triggers.py 新增路由模块 @router.get("", response_model=list[UnifiedTriggerItem]) async def get_unified_triggers( user: CurrentUser = Depends(get_current_user), ) -> list[UnifiedTriggerItem]: """聚合三张表的触发器数据。""" ``` 响应 Schema: ```python class UnifiedTriggerItem(BaseModel): id: int name: str source: str # biz / ai / etl trigger_condition: str # cron / interval / event status: str # running / idle / error / disabled last_run_at: str | None = None next_run_at: str | None = None last_error: str | None = None ``` 逻辑: 1. 查询 `biz.trigger_jobs`,映射 source="biz" 2. 查询 `biz.ai_trigger_jobs`(最近 100 条),映射 source="ai" 3. 查询 `scheduled_tasks`,映射 source="etl" 4. 统一字段格式后合并返回 ### 新增前端 API 模块 ```typescript // src/api/dbHealth.ts export interface DbHealthItem { db_name: string; status: 'connected' | 'disconnected'; active_connections: number | null; idle_connections: number | null; db_size_mb: number | null; slow_query_count: number | null; } export async function fetchDbHealth(): Promise { const { data } = await apiClient.get('/admin/db-health'); return data; } // src/api/triggers.ts export interface UnifiedTriggerItem { id: number; name: string; source: 'biz' | 'ai' | 'etl'; trigger_condition: string; status: string; last_run_at: string | null; next_run_at: string | null; last_error: string | null; } export async function fetchUnifiedTriggers(): Promise { const { data } = await apiClient.get('/admin/triggers/unified'); return data; } // src/api/triggerJobs.ts 新增 export interface UpdateTriggerConfigReq { cron_expression?: string; interval_seconds?: number; } export async function updateTriggerConfig( jobId: number, body: UpdateTriggerConfigReq ): Promise { const { data } = await apiClient.patch(`/trigger-jobs/${jobId}/config`, body); return data; } ``` ### 修改的现有组件 #### App.tsx 路由重构 - NAV_ITEMS 从 11 个一级项重组为 7 个 - Routes 更新为新路由结构 - 添加 `/` → `/dashboard` 重定向 - 添加 `/log-viewer` → `/etl-tasks?tab=manager` 重定向 - 登录成功后导航到 `/dashboard` #### OpsPanel 组件拆分 将 OpsPanel.tsx 拆分为可独立使用的子组件: - `ServiceStatusSection`:服务状态卡片 - `GitStatusSection`:Git 状态卡片 - `SystemResourceSection`:系统资源卡片 Dashboard 页面 import 这些子组件进行聚合展示。 ## 数据模型 ### 新增后端 Pydantic 模型 #### UpdateTriggerConfigRequest ```python class UpdateTriggerConfigRequest(BaseModel): """触发器配置编辑请求(部分更新)""" cron_expression: str | None = None # 5 字段 cron 表达式 interval_seconds: int | None = None # 间隔秒数,>= 1 @model_validator(mode='after') def at_least_one_field(self) -> Self: if self.cron_expression is None and self.interval_seconds is None: raise ValueError('至少提供 cron_expression 或 interval_seconds 之一') return self ``` #### DbHealthItem ```python class DbHealthItem(BaseModel): """单个数据库健康状态""" db_name: str status: Literal['connected', 'disconnected'] active_connections: int | None = None idle_connections: int | None = None db_size_mb: float | None = None slow_query_count: int | None = None ``` #### UnifiedTriggerItem ```python class UnifiedTriggerItem(BaseModel): """统一触发器视图项""" id: int name: str source: Literal['biz', 'ai', 'etl'] trigger_condition: str status: str last_run_at: str | None = None next_run_at: str | None = None last_error: str | None = None ``` ### 新增前端 TypeScript 类型 ```typescript // 数据库健康 interface DbHealthItem { db_name: string; status: 'connected' | 'disconnected'; active_connections: number | null; idle_connections: number | null; db_size_mb: number | null; slow_query_count: number | null; } // 统一触发器 interface UnifiedTriggerItem { id: number; name: string; source: 'biz' | 'ai' | 'etl'; trigger_condition: string; status: string; last_run_at: string | null; next_run_at: string | null; last_error: string | null; } // 触发器配置编辑 interface UpdateTriggerConfigReq { cron_expression?: string; interval_seconds?: number; } ``` ### 数据库变更 本次重构不新增数据库表。所有数据来自现有表: | 表 | 库 | 用途 | |----|-----|------| | biz.trigger_jobs | zqyy_app | 4 个业务触发器 | | biz.ai_trigger_jobs | zqyy_app | AI 事件链触发器 | | scheduled_tasks | zqyy_app | ETL 调度任务 | | pg_stat_activity | 各库 | 连接池状态 | | pg_database | 各库 | 数据库大小 | ### Cron 表达式校验规则 PATCH API 中的 cron_expression 校验逻辑: ```python import re CRON_FIELD_PATTERNS = [ r'(\*|[0-5]?\d)', # minute: 0-59 r'(\*|[01]?\d|2[0-3])', # hour: 0-23 r'(\*|[1-9]|[12]\d|3[01])', # day of month: 1-31 r'(\*|[1-9]|1[0-2])', # month: 1-12 r'(\*|[0-6])', # day of week: 0-6 ] def validate_cron_expression(expr: str) -> bool: """校验 5 字段 cron 表达式基本格式。""" parts = expr.strip().split() if len(parts) != 5: return False for part, pattern in zip(parts, CRON_FIELD_PATTERNS): if not re.fullmatch(pattern, part): return False return True ``` ## 正确性属性 *属性是系统在所有有效执行中都应保持为真的特征或行为——本质上是关于系统应该做什么的形式化陈述。属性是人类可读规范与机器可验证正确性保证之间的桥梁。* ### 属性 1:DB 健康 API 已连接数据库返回完整指标 *对于任意* 处于 `connected` 状态的数据库健康响应项,其 `active_connections`、`idle_connections`、`db_size_mb`、`slow_query_count` 字段均不为 null 且类型正确(连接数为非负整数,大小为非负浮点数)。 **验证需求:2.4, 6.2** ### 属性 2:Tab 切换状态保持 round-trip *对于任意* ETL 任务管理或触发器管理的 Tab 视图,在某个 Tab 中设置筛选条件后切换到另一个 Tab 再切回来,原 Tab 的筛选条件应保持不变。 **验证需求:3.5** ### 属性 3:触发器统一视图数据完整性与字段完整性 *对于任意* 一组来自 biz.trigger_jobs、biz.ai_trigger_jobs、scheduled_tasks 三个数据源的触发器数据,统一视图 API 返回的记录总数应等于三个数据源记录数之和,且每条记录都包含 name、source、trigger_condition、status、last_run_at、next_run_at、last_error 字段。 **验证需求:4.1, 4.2** ### 属性 4:触发器配置编辑不变量 *对于任意* 通过 PATCH /api/trigger-jobs/{id}/config 的成功更新请求,trigger_job 中除 trigger_config 内的 cron_expression / interval_seconds 和 next_run_at 外的所有字段(id、job_type、job_name、trigger_condition、status、description、created_at)应保持不变。 **验证需求:4.7** ### 属性 5:触发器配置更新正确性 *对于任意* 有效的 cron_expression(符合 5 字段 cron 语法)或有效的 interval_seconds(>= 1),通过 PATCH API 更新后,返回的 trigger_job 中 trigger_config 对应字段值应等于请求值,且 next_run_at 应被重新计算为非 null 值。 **验证需求:5.2, 5.3, 5.7** ### 属性 6:触发器配置校验拒绝无效输入 *对于任意* 不符合 5 字段 cron 语法的字符串作为 cron_expression,或任意小于 1 的整数作为 interval_seconds,PATCH API 应返回 HTTP 422 状态码,且响应体包含描述性错误信息。 **验证需求:5.4, 5.5** ### 属性 7:侧边栏高亮与当前路由一致 *对于任意* 有效的应用路由路径,侧边栏中被高亮(selectedKeys)的菜单项应对应该路由所属的一级模块。 **验证需求:10.3** ### 属性 8:Tab 切换与 URL 查询参数同步 round-trip *对于任意* Tab 视图页面(ETL 任务管理、触发器管理),设置 URL 查询参数 `?tab=X` 后渲染页面,当前激活的 Tab 应为 X;反之,点击 Tab Y 后,URL 查询参数应更新为 `?tab=Y`。 **验证需求:10.4** ## 错误处理 ### 前端错误处理 | 场景 | 处理方式 | |------|----------| | API 请求失败(网络错误) | Ant Design `message.error()` 提示,保持当前页面状态 | | API 返回 401 | 现有 axios 拦截器自动处理:尝试 refresh token → 失败则跳转 /login | | API 返回 422(校验错误) | 在编辑表单中展示具体错误信息(如"cron 表达式格式无效") | | API 返回 500 | `message.error()` 提示通用错误信息 | | 组件渲染异常 | 现有 ErrorBoundary 组件捕获,展示降级 UI | | DB 健康 API 超时 | DbHealthCard 展示"加载超时"状态,提供重试按钮 | | 触发器统一 API 部分数据源失败 | 后端返回可用数据源的数据,前端正常展示已获取的数据 | ### 后端错误处理 | 场景 | 处理方式 | |------|----------| | PATCH API:trigger_job 不存在 | 返回 HTTP 404 + `{"detail": "任务 {id} 不存在"}` | | PATCH API:cron_expression 格式无效 | 返回 HTTP 422 + `{"detail": "cron 表达式格式无效,需要 5 字段格式"}` | | PATCH API:interval_seconds < 1 | 返回 HTTP 422 + `{"detail": "interval_seconds 必须 >= 1"}` | | PATCH API:请求体为空 | 返回 HTTP 422 + `{"detail": "至少提供 cron_expression 或 interval_seconds 之一"}` | | DB 健康 API:某库连接失败 | 该库返回 `status: "disconnected"`,其余指标为 null,不影响其他库 | | DB 健康 API:所有库连接失败 | 返回 4 个 disconnected 项,HTTP 200(不返回 500) | | 统一触发器 API:某数据源查询失败 | 记录日志,返回其他数据源的数据,失败的数据源不包含在结果中 | | JWT 认证失败 | 返回 HTTP 401(现有中间件处理) | ## 测试策略 ### 双重测试方法 本项目采用单元测试 + 属性测试的双重策略: - **单元测试(Vitest)**:验证具体示例、边界条件、错误场景 - **属性测试(fast-check)**:验证跨所有输入的通用属性 - 两者互补:单元测试捕获具体 bug,属性测试验证通用正确性 ### 前端测试 **工具**:Vitest + @testing-library/react + fast-check **属性测试配置**: - 每个属性测试最少运行 100 次迭代 - 每个属性测试必须用注释引用设计文档中的属性编号 - 标签格式:`Feature: admin-web-restructure, Property {number}: {property_text}` **单元测试覆盖**: - 菜单结构验证(7 个一级菜单项、子项正确性) - 路由重定向(/ → /dashboard、/log-viewer → /etl-tasks) - Dashboard 区块渲染 - Tab 组件默认 Tab 选择 - DbHealthCard 各状态渲染(connected / disconnected) **属性测试覆盖**: - 属性 2:Tab 状态保持 round-trip - 属性 7:侧边栏高亮与路由一致 - 属性 8:Tab-URL 参数同步 round-trip ### 后端测试 **工具**:pytest + hypothesis **属性测试配置**: - 每个属性测试使用 `@settings(max_examples=100)` - 标签格式同上 **单元测试覆盖**: - PATCH API 端点存在性 - JWT 认证拦截 - DB 健康 API 端点存在性 - 统一触发器 API 端点存在性 **属性测试覆盖**: - 属性 1:DB 健康 API 已连接数据库返回完整指标 - 属性 3:触发器统一视图数据完整性 - 属性 4:触发器配置编辑不变量 - 属性 5:触发器配置更新正确性 - 属性 6:触发器配置校验拒绝无效输入 ### E2E 测试 **工具**:Playwright **覆盖范围**(每个新页面一个测试文件): - `dashboard.spec.ts`:Dashboard 页面渲染、4 个区块存在、跳转链接正确 - `etl-tasks.spec.ts`:ETL 任务管理 Tab 切换、各 Tab 内容渲染 - `trigger-manager.spec.ts`:触发器管理 4 个 Tab、统一视图数据、业务 Tab 编辑功能 - `navigation.spec.ts`:默认路由、重定向、菜单高亮、Tab-URL 同步 **测试批次**:每个测试文件控制在 Playwright 默认超时(30s)范围内。