feat: 2026-04-15~05-02 累积变更基线 — AI 重构 + Runtime Context + DWS 修复

涵盖(每条对应已存的审计记录):
- AI 模块拆分:apps/backend/app/ai/apps -> prompts/(8 个 APP + app2a 派生)
  audit: 2026-04-20__ai-module-complete.md
- admin-web AI 管理套件:AIDashboard / AIOperations / AIRunLogs / AITriggers / TriggerManager
  audit: 2026-04-21__admin-web-ai-management-suite.md
- App2 财务洞察 prompt v3 -> v5.1 + 小程序 AI 接入(chat / board-finance)
  audit: 2026-04-22__app2_prompt_v5_1_and_miniprogram_ai_insight.md
- App2 prewarm 全过滤器 + AI 触发器 cron reschedule
  audit: 2026-04-21__app2-finance-prewarm-all-filters.md
  migration: 20260420_ai_trigger_jobs_and_app2_prewarm.sql / 20260421_app2_prewarm_cron_reschedule.sql
- AppType 联合类型对齐 + adminAiAppTypes.test.ts
  audit: 2026-04-30__admin_web_ai_app_type_alignment.md
- DashScope tokens_used 提取修复
  audit: 2026-04-30__backend_dashscope_tokens_used_extraction.md
- App3 线索完整详情 prompt
  audit: 2026-05-01__backend_app3_full_detail_prompt.md
- Runtime Context 沙箱(5-1~5-2 主线):
  - 后端 schema/service + admin_runtime_context / xcx_runtime_clock 两个 router
  - admin-web RuntimeContext.tsx + miniprogram runtime-clock.ts
  - migration: 20260501__runtime_context_sandbox.sql
  - tools/db/verify_admin_web_sandbox.py + verify_sandbox_end_to_end.py
  - database/changes: 7 份 sandbox_* 验证报告
- 飞球 DWS 修复:finance_area_daily 区域汇总 + task_engine 调整
  + RLS 视图业务日上界(migration 20260502 + scripts/ops/gen_rls_business_date_migration.py)

合规:
- .gitignore 启用 tmp/ 排除
- 不入仓:apps/etl/connectors/feiqiu/.env(API_TOKEN secret,本地修改保留)

待验证清单:
- docs/audit/changes/2026-05-04__cumulative_baseline_pending_verification.md
  每个主题的功能完整性 / 上线验证几乎都未收口,按优先级 P0~P3 逐一处理
This commit is contained in:
Neo
2026-05-04 02:30:19 +08:00
parent 2010034840
commit caf179a5da
130 changed files with 14543 additions and 2717 deletions

View File

@@ -0,0 +1,42 @@
# App2 财务洞察 · 百炼 system prompt 版本记录
> 当前生产版本:**V5.1**2026-04-22 采纳)
> 部署位置:百炼控制台 APP ID `1dcdb5f39c3040b6af8ef79215b9b051`
## 版本总览
| 版本 | 文件 | 字节 | 状态 | 采纳日 |
|---|---|:---:|:---:|:---:|
| v3 修订 (A) | [app2_finance_system_prompt_20260422.md](app2_finance_system_prompt_20260422.md) | 13500 | 📦 归档 | — |
| v4 concise (B) | [app2_finance_system_prompt_20260422_v4_concise.md](app2_finance_system_prompt_20260422_v4_concise.md) | 5330 | 📦 归档 | — |
| v5 | [app2_finance_system_prompt_20260422_v5.md](app2_finance_system_prompt_20260422_v5.md) | 15612 | 📦 归档 | — |
| **V5.1** | [app2_finance_system_prompt_20260422_v5_1.md](app2_finance_system_prompt_20260422_v5_1.md) | 15886 | ✅ **生产** | **2026-04-22** |
## V5.1 采纳依据(四方 × 10 次 A/B/A/B 测试 · 店长视角评分)
| 维度 | A | B | V5 | **V5.1** |
|---|:---:|:---:|:---:|:---:|
| **综合分 / 100** | 74.6 | 74.1 | 85.2 | **92.3** |
| 准确性 (40%) | 66.5 | 71.9 | 77.9 | **98.8** |
| 洞察深度 (35%) | 87.5 | 80.0 | 100.0 | 100.0 |
| 稳定性 (25%) | 69.7 | 69.3 | 76.0 | 71.2 |
**V5.1 核心优势**
- 准确性 98.8(近满分) · 对比口径显式引用 0%→100% · 数据完整性标注 100% · 单期推测违规从 A 的 1.0 次/次降至 0.4 次/次
- 洞察深度 100 · seq 11 每次都列"原因 1 + 原因 2 + 意义解读"
- 稳定性 71.2(字数 CV 最优 0.09,时长均 77s · 10 次全 🔴 符合"同数据结论应一致"
## 评估方法
内容质量分析脚本:[scripts/analyze_store_manager_quality.py](../../scripts/analyze_store_manager_quality.py) · 店长视角三层模型:
1. **准确性** 40%:对比口径显式、权威字段、规则合规、单期推测违规、数据完整性标注
2. **洞察深度** 35%深度信号命中、seq 11 top 2 + 意义解读、seq 12 跟踪四要素、多指标协同
3. **稳定性** 25%:评级众数占比、原因信号 IoU、跟踪指标一致性、字数/时长 CV
测试存档:[export/ai-ab-test/](../../export/ai-ab-test/)4 × 10 = 40 份完整 JSON + 店长视角综合评分 JSON
## 变更规则
1. 生产版本变更必须通过店长视角评分 ≥ 本版本当前分V5.1 为 92.3
2. 采纳前做不少于 10 次测试(保留存档)
3. 本文档只追加不覆盖,每版必须有采纳日期