Files
Neo-ZQYY/docs/audit/changes/2026-04-30__backend_dashscope_tokens_used_extraction.md
Neo caf179a5da feat: 2026-04-15~05-02 累积变更基线 — AI 重构 + Runtime Context + DWS 修复
涵盖(每条对应已存的审计记录):
- AI 模块拆分:apps/backend/app/ai/apps -> prompts/(8 个 APP + app2a 派生)
  audit: 2026-04-20__ai-module-complete.md
- admin-web AI 管理套件:AIDashboard / AIOperations / AIRunLogs / AITriggers / TriggerManager
  audit: 2026-04-21__admin-web-ai-management-suite.md
- App2 财务洞察 prompt v3 -> v5.1 + 小程序 AI 接入(chat / board-finance)
  audit: 2026-04-22__app2_prompt_v5_1_and_miniprogram_ai_insight.md
- App2 prewarm 全过滤器 + AI 触发器 cron reschedule
  audit: 2026-04-21__app2-finance-prewarm-all-filters.md
  migration: 20260420_ai_trigger_jobs_and_app2_prewarm.sql / 20260421_app2_prewarm_cron_reschedule.sql
- AppType 联合类型对齐 + adminAiAppTypes.test.ts
  audit: 2026-04-30__admin_web_ai_app_type_alignment.md
- DashScope tokens_used 提取修复
  audit: 2026-04-30__backend_dashscope_tokens_used_extraction.md
- App3 线索完整详情 prompt
  audit: 2026-05-01__backend_app3_full_detail_prompt.md
- Runtime Context 沙箱(5-1~5-2 主线):
  - 后端 schema/service + admin_runtime_context / xcx_runtime_clock 两个 router
  - admin-web RuntimeContext.tsx + miniprogram runtime-clock.ts
  - migration: 20260501__runtime_context_sandbox.sql
  - tools/db/verify_admin_web_sandbox.py + verify_sandbox_end_to_end.py
  - database/changes: 7 份 sandbox_* 验证报告
- 飞球 DWS 修复:finance_area_daily 区域汇总 + task_engine 调整
  + RLS 视图业务日上界(migration 20260502 + scripts/ops/gen_rls_business_date_migration.py)

合规:
- .gitignore 启用 tmp/ 排除
- 不入仓:apps/etl/connectors/feiqiu/.env(API_TOKEN secret,本地修改保留)

待验证清单:
- docs/audit/changes/2026-05-04__cumulative_baseline_pending_verification.md
  每个主题的功能完整性 / 上线验证几乎都未收口,按优先级 P0~P3 逐一处理
2026-05-04 02:30:19 +08:00

4.4 KiB
Raw Blame History

审计记录:后端 DashScope tokens_used 提取修复

日期2026-04-30 会话:处理接管台账 A1-02,修复 DashScope usage.models 嵌套结构下 tokens_used=0 的预算追踪问题 影响范围apps/backend/app/ai/dashscope_client.pyapps/backend/tests/tests/unit/test_dashscope_client_usage.py


变更背景

AI 验收文档和历史审计均记录 tokens_used=0 问题DashScope Application API 返回的 usage 不是旧的顶层 input_tokens/output_tokens,而是 ApplicationUsage(models=[ApplicationModelUsage(...)])。如果无法正确提取 token 计数,会影响:

  • biz.ai_run_logs.tokens_used 写入
  • admin-web AI 调用记录和预算展示
  • BudgetTracker 的日/月 token 用量判断

调研时发现当前工作区已有一段未提交的半修复:可处理 SDK 对象形态 usage.models,但普通 dict 形态 {"models": [...]} 仍会漏算为 0。


变更摘要

apps/backend/app/ai/dashscope_client.py

  • 新增 _field_value(),统一读取 dict、DashScope DictMixin、普通对象字段。
  • 新增 _safe_int(),对 token 字段做安全整数转换,异常值按 0 处理。
  • 新增 _extract_tokens_used(),按以下优先级提取 token
    • usage.models[*].input_tokens/output_tokens
    • usage.total_tokens
    • usage.input_tokens/output_tokens
  • DashScopeClient.call_app() 改为调用 _extract_tokens_used(response.usage),避免分支逻辑散落在主流程中。

apps/backend/tests/tests/unit/test_dashscope_client_usage.py

  • 新增 5 个单元测试,覆盖:
    • SDK ApplicationUsage(models=[...])
    • 普通 dict {"models": [...]}
    • 顶层 dict input_tokens/output_tokens
    • 对象 total_tokens
    • usage 缺失时返回 0

TDD 记录

先新增测试并运行 RED

cd apps/backend
C:\Project\NeoZQYY\.venv\Scripts\python.exe -m pytest tests/tests/unit/test_dashscope_client_usage.py -q

RED 结果5 个测试中 1 个失败,失败用例为 test_call_app_sums_tokens_from_plain_dict_models,实际返回 0,符合预期复现。

修复后再次运行同一测试:

C:\Project\NeoZQYY\.venv\Scripts\python.exe -m pytest tests/tests/unit/test_dashscope_client_usage.py -q

GREEN 结果5/5 通过。


验证

已执行:

cd apps/backend
C:\Project\NeoZQYY\.venv\Scripts\python.exe -m compileall app/ai/dashscope_client.py
C:\Project\NeoZQYY\.venv\Scripts\python.exe -m pytest tests/tests/unit/test_dashscope_client_usage.py tests/tests/unit/test_xcx_chat_ai_fallback.py::TestAIFallback::test_ai_success_returns_real_reply -q
C:\Project\NeoZQYY\.venv\Scripts\python.exe -m pytest tests/tests/integration/test_ai_full_chain.py::test_note_chain -q
C:\Project\NeoZQYY\.venv\Scripts\python.exe -m pytest tests/tests/integration/test_ai_full_chain.py::test_failure_logging -q
C:\Project\NeoZQYY\.venv\Scripts\python.exe -m pytest tests/tests/test_ai_prompts_smoke.py::test_dispatcher_registers_5_handlers -q

结果:

  • compileall:通过。
  • token 提取与对话成功路径6/6 通过。
  • AI note chain通过。
  • failure logging通过。
  • dispatcher handler 注册:通过。

补充验证:

  • tests/tests/test_ai_dispatcher.py 全文件运行 124 秒超时。
  • 单独运行 TestProperty10ChainOrder::test_note_event 时,失败原因为 Hypothesis DeadlineExceeded:单例耗时约 3.6s,超过默认 200ms不是断言失败也不是本次 token 提取逻辑失败。该测试债未在本次修复中处理。

风险与影响

风险 结论
预算追踪 新成功调用可从 usage.models 正确累加 token改善日/月预算统计可信度
旧数据 已写入为 0 的历史 run log 不会自动回填;如需历史修正需另做数据方案
DashScope SDK 形态变化 覆盖 SDK 对象、普通 dict 和旧 total_tokens 形态,兼容性较当前实现更强
真实外部调用 本次未消耗真实 DashScope token仍需后续用真实 APP 调用验证 success AND tokens_used>0

回滚

如需回滚本次修复:

git restore apps/backend/app/ai/dashscope_client.py
Remove-Item -LiteralPath apps/backend/tests/tests/unit/test_dashscope_client_usage.py

回滚后普通 dict models 形态会重新漏算为 0若回到 HEAD 基线SDK ApplicationUsage.models 形态也会重新漏算。