# App2 财务洞察 · 百炼 system prompt 版本记录 > 当前生产版本:**V5.1**(2026-04-22 采纳) > 部署位置:百炼控制台 APP ID `1dcdb5f39c3040b6af8ef79215b9b051` ## 版本总览 | 版本 | 文件 | 字节 | 状态 | 采纳日 | |---|---|:---:|:---:|:---:| | v3 修订 (A) | [app2_finance_system_prompt_20260422.md](app2_finance_system_prompt_20260422.md) | 13500 | 📦 归档 | — | | v4 concise (B) | [app2_finance_system_prompt_20260422_v4_concise.md](app2_finance_system_prompt_20260422_v4_concise.md) | 5330 | 📦 归档 | — | | v5 | [app2_finance_system_prompt_20260422_v5.md](app2_finance_system_prompt_20260422_v5.md) | 15612 | 📦 归档 | — | | **V5.1** | [app2_finance_system_prompt_20260422_v5_1.md](app2_finance_system_prompt_20260422_v5_1.md) | 15886 | ✅ **生产** | **2026-04-22** | ## V5.1 采纳依据(四方 × 10 次 A/B/A/B 测试 · 店长视角评分) | 维度 | A | B | V5 | **V5.1** | |---|:---:|:---:|:---:|:---:| | **综合分 / 100** | 74.6 | 74.1 | 85.2 | **92.3** | | 准确性 (40%) | 66.5 | 71.9 | 77.9 | **98.8** | | 洞察深度 (35%) | 87.5 | 80.0 | 100.0 | 100.0 | | 稳定性 (25%) | 69.7 | 69.3 | 76.0 | 71.2 | **V5.1 核心优势**: - 准确性 98.8(近满分) · 对比口径显式引用 0%→100% · 数据完整性标注 100% · 单期推测违规从 A 的 1.0 次/次降至 0.4 次/次 - 洞察深度 100 · seq 11 每次都列"原因 1 + 原因 2 + 意义解读" - 稳定性 71.2(字数 CV 最优 0.09,时长均 77s · 10 次全 🔴 符合"同数据结论应一致") ## 评估方法 内容质量分析脚本:[scripts/analyze_store_manager_quality.py](../../scripts/analyze_store_manager_quality.py) · 店长视角三层模型: 1. **准确性** 40%:对比口径显式、权威字段、规则合规、单期推测违规、数据完整性标注 2. **洞察深度** 35%:深度信号命中、seq 11 top 2 + 意义解读、seq 12 跟踪四要素、多指标协同 3. **稳定性** 25%:评级众数占比、原因信号 IoU、跟踪指标一致性、字数/时长 CV 测试存档:[export/ai-ab-test/](../../export/ai-ab-test/)(4 × 10 = 40 份完整 JSON + 店长视角综合评分 JSON) ## 变更规则 1. 生产版本变更必须通过店长视角评分 ≥ 本版本当前分(V5.1 为 92.3) 2. 采纳前做不少于 10 次测试(保留存档) 3. 本文档只追加不覆盖,每版必须有采纳日期