init: 项目初始提交 - NeoZQYY Monorepo 完整代码
This commit is contained in:
346
apps/etl/pipelines/feiqiu/docs/etl_tasks/README.md
Normal file
346
apps/etl/pipelines/feiqiu/docs/etl_tasks/README.md
Normal file
@@ -0,0 +1,346 @@
|
||||
# 飞球 ETL 任务说明文档
|
||||
|
||||
> 本文档是飞球 ETL 系统(etl-billiards)任务说明的总览入口。
|
||||
> 系统从上游 SaaS API 抽取台球门店运营数据,经 ODS → DWD → DWS 三层处理后,
|
||||
> 输出助教业绩、财务日报、会员分析、工资计算及自定义指数等业务报表。
|
||||
|
||||
## 目录
|
||||
|
||||
- [数据流向](#数据流向)
|
||||
- [文档索引](#文档索引)
|
||||
- [任务清单](#任务清单)
|
||||
- [ODS 层(操作数据存储)](#ods-层操作数据存储)
|
||||
- [DWD 层(明细数据)](#dwd-层明细数据)
|
||||
- [DWS 层(数据服务)](#dws-层数据服务)
|
||||
- [INDEX 层(指数算法)](#index-层指数算法)
|
||||
- [工具类 / 校验类](#工具类--校验类)
|
||||
- [管道类型](#管道类型)
|
||||
- [处理模式](#处理模式)
|
||||
- [数据源模式](#数据源模式)
|
||||
- [CLI 参数速查表](#cli-参数速查表)
|
||||
- [常见命令示例](#常见命令示例)
|
||||
|
||||
---
|
||||
|
||||
## 数据流向
|
||||
|
||||
```mermaid
|
||||
graph LR
|
||||
API["上游 SaaS API"] -->|抓取| ODS["ODS<br/>操作数据存储层"]
|
||||
JSON["本地 JSON 文件"] -->|手动入库| ODS
|
||||
ODS -->|清洗 / SCD2 / 增量| DWD["DWD<br/>明细数据层"]
|
||||
DWD -->|聚合 / 计算| DWS["DWS<br/>数据服务层"]
|
||||
DWD -->|指数算法| INDEX["INDEX<br/>指数算法层"]
|
||||
DWS --> REPORT["业务报表<br/>助教业绩 · 财务日报<br/>会员分析 · 工资计算"]
|
||||
INDEX --> REPORT
|
||||
```
|
||||
|
||||
**层级说明:**
|
||||
|
||||
| 层 | Schema | 职责 |
|
||||
|---|---|---|
|
||||
| ODS | `billiards_ods` | 保留 API 原始 payload,便于回溯 |
|
||||
| DWD | `billiards_dwd` | 清洗后的维度表(dim_*,SCD2)和事实表(fact_* / dwd_*,增量) |
|
||||
| DWS | `billiards_dws` | 按业务维度聚合的汇总统计表 |
|
||||
| INDEX | `billiards_dws` | 基于 DWD/DWS 数据计算的自定义业务指数 |
|
||||
|
||||
---
|
||||
|
||||
## 文档索引
|
||||
|
||||
| 文档 | 说明 |
|
||||
|------|------|
|
||||
| [BaseTask 公共机制](base_task_mechanism.md) | 任务基类模板方法、TaskContext、时间窗口、注册表、管道执行 |
|
||||
| [ODS 层任务](ods_tasks.md) | 23 个通用 ODS 任务的架构、配置结构、API 端点、目标表 |
|
||||
| [DWD 层任务](dwd_tasks.md) | DWD_LOAD_FROM_ODS 核心装载、SCD2 处理、质量校验 |
|
||||
| [DWS 层任务](dws_tasks.md) | 助教业绩、会员分析、财务统计、运维任务共 15 个 DWS 任务 |
|
||||
| [INDEX 层任务](index_tasks.md) | WBI/NCI/RS 指数算法 + ML 手动台账导入 |
|
||||
| [工具类任务](utility_tasks.md) | Schema 初始化、手动入库、归档、截止检查、完整性校验 |
|
||||
|
||||
---
|
||||
|
||||
## 任务清单
|
||||
|
||||
### ODS 层(操作数据存储)
|
||||
|
||||
#### 通用 ODS 任务(OdsTaskSpec 动态注册)
|
||||
|
||||
| 任务代码 | Python 类 | 目标表 | 简要说明 | 详情 |
|
||||
|----------|-----------|--------|----------|------|
|
||||
| `ODS_ASSISTANT_ACCOUNT` | `OdsAssistantAccountsTask` | `billiards_ods.assistant_accounts_master` | 助教账号档案 | [查看](ods_tasks.md) |
|
||||
| `ODS_ASSISTANT_LEDGER` | `OdsAssistantLedgerTask` | `billiards_ods.assistant_service_records` | 助教服务流水 | [查看](ods_tasks.md) |
|
||||
| `ODS_ASSISTANT_ABOLISH` | `OdsAssistantAbolishTask` | `billiards_ods.assistant_cancellation_records` | 助教废除记录 | [查看](ods_tasks.md) |
|
||||
| `ODS_INVENTORY_CHANGE` | `OdsInventoryChangeTask` | `billiards_ods.goods_stock_movements` | 库存变化记录 | [查看](ods_tasks.md) |
|
||||
| `ODS_INVENTORY_STOCK` | `OdsInventoryStockTask` | `billiards_ods.goods_stock_summary` | 库存汇总 | [查看](ods_tasks.md) |
|
||||
| `ODS_GROUP_PACKAGE` | `OdsPackageTask` | `billiards_ods.group_buy_packages` | 团购套餐定义 | [查看](ods_tasks.md) |
|
||||
| `ODS_GROUP_BUY_REDEMPTION` | `OdsGroupBuyRedemptionTask` | `billiards_ods.group_buy_redemption_records` | 团购套餐核销 | [查看](ods_tasks.md) |
|
||||
| `ODS_MEMBER` | `OdsMemberTask` | `billiards_ods.member_profiles` | 会员档案 | [查看](ods_tasks.md) |
|
||||
| `ODS_MEMBER_BALANCE` | `OdsMemberBalanceTask` | `billiards_ods.member_balance_changes` | 会员余额变动 | [查看](ods_tasks.md) |
|
||||
| `ODS_MEMBER_CARD` | `OdsMemberCardTask` | `billiards_ods.member_stored_value_cards` | 会员储值卡 | [查看](ods_tasks.md) |
|
||||
| `ODS_PAYMENT` | `OdsPaymentTask` | `billiards_ods.payment_transactions` | 支付流水 | [查看](ods_tasks.md) |
|
||||
| `ODS_REFUND` | `OdsRefundTask` | `billiards_ods.refund_transactions` | 退款流水 | [查看](ods_tasks.md) |
|
||||
| `ODS_PLATFORM_COUPON` | `OdsCouponVerifyTask` | `billiards_ods.platform_coupon_redemption_records` | 平台/团购券核销 | [查看](ods_tasks.md) |
|
||||
| `ODS_RECHARGE_SETTLE` | `OdsRechargeSettleTask` | `billiards_ods.recharge_settlements` | 充值结算 | [查看](ods_tasks.md) |
|
||||
| `ODS_TABLE_USE` | `OdsTableUseTask` | `billiards_ods.table_fee_transactions` | 台费计费流水 | [查看](ods_tasks.md) |
|
||||
| `ODS_TABLES` | `OdsTablesTask` | `billiards_ods.site_tables_master` | 台桌维表 | [查看](ods_tasks.md) |
|
||||
| `ODS_GOODS_CATEGORY` | `OdsGoodsCategoryTask` | `billiards_ods.stock_goods_category_tree` | 库存商品分类 | [查看](ods_tasks.md) |
|
||||
| `ODS_STORE_GOODS` | `OdsStoreGoodsTask` | `billiards_ods.store_goods_master` | 门店商品档案 | [查看](ods_tasks.md) |
|
||||
| `ODS_TABLE_FEE_DISCOUNT` | `OdsTableDiscountTask` | `billiards_ods.table_fee_discount_records` | 台费折扣/调账 | [查看](ods_tasks.md) |
|
||||
| `ODS_STORE_GOODS_SALES` | `OdsGoodsLedgerTask` | `billiards_ods.store_goods_sales_records` | 门店商品销售流水 | [查看](ods_tasks.md) |
|
||||
| `ODS_TENANT_GOODS` | `OdsTenantGoodsTask` | `billiards_ods.tenant_goods_master` | 租户商品档案 | [查看](ods_tasks.md) |
|
||||
| `ODS_SETTLEMENT_TICKET` | `OdsSettlementTicketTask` | `billiards_ods.settlement_ticket_details` | 结账小票详情 | [查看](ods_tasks.md) |
|
||||
| `ODS_SETTLEMENT_RECORDS` | `OdsOrderSettleTask` | `billiards_ods.settlement_records` | 结账记录 | [查看](ods_tasks.md) |
|
||||
|
||||
### DWD 层(明细数据)
|
||||
|
||||
| 任务代码 | Python 类 | 简要说明 | 详情 |
|
||||
|----------|-----------|----------|------|
|
||||
| `DWD_LOAD_FROM_ODS` | `DwdLoadTask` | 核心装载:遍历 TABLE_MAP,维度走 SCD2,事实走增量 | [查看](dwd_tasks.md) |
|
||||
| `DWD_QUALITY_CHECK` | `DwdQualityTask` | ODS 与 DWD 行数/金额核对,输出 JSON 报表 | [查看](dwd_tasks.md) |
|
||||
|
||||
### DWS 层(数据服务)
|
||||
|
||||
#### 助教业绩域
|
||||
|
||||
| 任务代码 | Python 类 | 目标表 | 粒度 | 详情 |
|
||||
|----------|-----------|--------|------|------|
|
||||
| `DWS_ASSISTANT_DAILY` | `AssistantDailyTask` | `dws_assistant_daily_detail` | 日期+助教 | [查看](dws_tasks.md) |
|
||||
| `DWS_ASSISTANT_MONTHLY` | `AssistantMonthlyTask` | `dws_assistant_monthly_summary` | 月份+助教 | [查看](dws_tasks.md) |
|
||||
| `DWS_ASSISTANT_CUSTOMER` | `AssistantCustomerTask` | `dws_assistant_customer_stats` | 日期+助教+会员 | [查看](dws_tasks.md) |
|
||||
| `DWS_ASSISTANT_SALARY` | `AssistantSalaryTask` | `dws_assistant_salary_calc` | 月份+助教 | [查看](dws_tasks.md) |
|
||||
| `DWS_ASSISTANT_FINANCE` | `AssistantFinanceTask` | `dws_assistant_finance_analysis` | 日期+助教 | [查看](dws_tasks.md) |
|
||||
|
||||
#### 会员分析域
|
||||
|
||||
| 任务代码 | Python 类 | 目标表 | 粒度 | 详情 |
|
||||
|----------|-----------|--------|------|------|
|
||||
| `DWS_MEMBER_CONSUMPTION` | `MemberConsumptionTask` | `dws_member_consumption_summary` | 日期+会员 | [查看](dws_tasks.md) |
|
||||
| `DWS_MEMBER_VISIT` | `MemberVisitTask` | `dws_member_visit_detail` | 日期+会员+结账单 | [查看](dws_tasks.md) |
|
||||
|
||||
#### 财务统计域
|
||||
|
||||
| 任务代码 | Python 类 | 目标表 | 粒度 | 详情 |
|
||||
|----------|-----------|--------|------|------|
|
||||
| `DWS_FINANCE_DAILY` | `FinanceDailyTask` | `dws_finance_daily_summary` | 日期 | [查看](dws_tasks.md) |
|
||||
| `DWS_FINANCE_RECHARGE` | `FinanceRechargeTask` | `dws_finance_recharge_summary` | 日期 | [查看](dws_tasks.md) |
|
||||
| `DWS_FINANCE_INCOME_STRUCTURE` | `FinanceIncomeStructureTask` | `dws_finance_income_structure` | 日期+收入类型 | [查看](dws_tasks.md) |
|
||||
| `DWS_FINANCE_DISCOUNT_DETAIL` | `FinanceDiscountDetailTask` | `dws_finance_discount_detail` | 日期+折扣类型 | [查看](dws_tasks.md) |
|
||||
|
||||
#### 运维任务
|
||||
|
||||
| 任务代码 | Python 类 | 简要说明 | 详情 |
|
||||
|----------|-----------|----------|------|
|
||||
| `DWS_BUILD_ORDER_SUMMARY` | `DwsBuildOrderSummaryTask` | 构建订单汇总中间表 | [查看](dws_tasks.md) |
|
||||
| `DWS_RETENTION_CLEANUP` | `DwsRetentionCleanupTask` | 按时间分层清理历史数据 | [查看](dws_tasks.md) |
|
||||
| `DWS_MV_REFRESH_FINANCE_DAILY` | `DwsMvRefreshFinanceDailyTask` | 刷新财务日报物化视图 | [查看](dws_tasks.md) |
|
||||
| `DWS_MV_REFRESH_ASSISTANT_DAILY` | `DwsMvRefreshAssistantDailyTask` | 刷新助教日报物化视图 | [查看](dws_tasks.md) |
|
||||
|
||||
### INDEX 层(指数算法)
|
||||
|
||||
| 任务代码 | Python 类 | 目标表 | 指数类型 | 详情 |
|
||||
|----------|-----------|--------|----------|------|
|
||||
| `DWS_WINBACK_INDEX` | `WinbackIndexTask` | `dws_member_winback_index` | WBI(回流指数) | [查看](index_tasks.md) |
|
||||
| `DWS_NEWCONV_INDEX` | `NewconvIndexTask` | `dws_member_newconv_index` | NCI(新客转化指数) | [查看](index_tasks.md) |
|
||||
| `DWS_RELATION_INDEX` | `RelationIndexTask` | `dws_relation_index` | RS(关系指数) | [查看](index_tasks.md) |
|
||||
| `DWS_ML_MANUAL_IMPORT` | `MlManualImportTask` | `dws_ml_manual_ledger` | ML(手动台账导入) | [查看](index_tasks.md) |
|
||||
|
||||
### 工具类 / 校验类
|
||||
|
||||
| 任务代码 | Python 类 | 类型 | 简要说明 | 详情 |
|
||||
|----------|-----------|------|----------|------|
|
||||
| `INIT_ODS_SCHEMA` | `InitOdsSchemaTask` | utility | 执行 ODS + etl_admin DDL,创建必要目录 | [查看](utility_tasks.md) |
|
||||
| `INIT_DWD_SCHEMA` | `InitDwdSchemaTask` | utility | 执行 DWD DDL | [查看](utility_tasks.md) |
|
||||
| `INIT_DWS_SCHEMA` | `InitDwsSchemaTask` | utility | 执行 DWS DDL | [查看](utility_tasks.md) |
|
||||
| `MANUAL_INGEST` | `ManualIngestTask` | utility | 从本地 JSON 文件手动入库到 ODS | [查看](utility_tasks.md) |
|
||||
| `ODS_JSON_ARCHIVE` | `OdsJsonArchiveTask` | utility | 归档 ODS JSON 文件 | [查看](utility_tasks.md) |
|
||||
| `CHECK_CUTOFF` | `CheckCutoffTask` | utility | 检查数据截止时间 | [查看](utility_tasks.md) |
|
||||
| `SEED_DWS_CONFIG` | `SeedDwsConfigTask` | utility | 初始化 DWS 配置种子数据 | [查看](utility_tasks.md) |
|
||||
| `DATA_INTEGRITY_CHECK` | `DataIntegrityTask` | verification | 数据完整性校验 | [查看](utility_tasks.md) |
|
||||
|
||||
---
|
||||
|
||||
## 管道类型
|
||||
|
||||
管道(Pipeline)定义了多层任务的执行顺序。通过 `--pipeline` 参数指定,系统自动解析对应层并按顺序执行该层的所有已注册任务。
|
||||
|
||||
| 管道类型 | 包含层 | 说明 |
|
||||
|----------|--------|------|
|
||||
| `api_ods` | ODS | 仅从 API 抓取数据到 ODS |
|
||||
| `api_ods_dwd` | ODS → DWD | 抓取数据并清洗装载到 DWD |
|
||||
| `api_full` | ODS → DWD → DWS → INDEX | 全流程:抓取 → 清洗 → 汇总 → 指数 |
|
||||
| `ods_dwd` | DWD | 仅执行 ODS → DWD 清洗装载(不抓取) |
|
||||
| `dwd_dws` | DWS | 仅执行 DWD → DWS 汇总计算 |
|
||||
| `dwd_dws_index` | DWS → INDEX | 汇总计算 + 指数算法 |
|
||||
| `dwd_index` | INDEX | 仅执行指数算法 |
|
||||
|
||||
> 管道定义位于 `orchestration/pipeline_runner.py` 的 `PipelineRunner.PIPELINE_LAYERS`。
|
||||
|
||||
---
|
||||
|
||||
## 处理模式
|
||||
|
||||
通过 `--processing-mode` 参数指定,控制管道的执行行为。
|
||||
|
||||
| 模式 | 说明 | 适用场景 |
|
||||
|------|------|----------|
|
||||
| `increment_only` | 仅增量处理(默认) | 日常定时调度,只处理新增/变更数据 |
|
||||
| `verify_only` | 仅校验并修复,跳过增量 ETL | 数据质量巡检、手动修复不一致 |
|
||||
| `increment_verify` | 先增量处理,再校验并修复 | 需要确保数据一致性的关键批次 |
|
||||
|
||||
**补充参数:**
|
||||
|
||||
- `--fetch-before-verify`:仅在 `verify_only` 模式下有效,校验前先从 API 获取最新数据
|
||||
- `--verify-tables`:指定仅校验的表名(逗号分隔),用于单表验证
|
||||
|
||||
---
|
||||
|
||||
## 数据源模式
|
||||
|
||||
通过 `--data-source` 参数指定,控制 ODS 层的数据来源。
|
||||
|
||||
| 模式 | 说明 | 适用场景 |
|
||||
|------|------|----------|
|
||||
| `online` | 仅在线抓取(从 API 获取数据) | 正常运行,网络可用 |
|
||||
| `offline` | 仅本地入库(从 JSON 文件读取) | 离线环境、JSON 回放 |
|
||||
| `hybrid` | 抓取 + 入库(默认) | 同时从 API 抓取并处理本地文件 |
|
||||
|
||||
> 旧参数 `--pipeline-flow`(`FULL` / `FETCH_ONLY` / `INGEST_ONLY`)已弃用,请使用 `--data-source`。
|
||||
|
||||
---
|
||||
|
||||
## CLI 参数速查表
|
||||
|
||||
入口命令:`python -m cli.main`
|
||||
|
||||
### 基本参数
|
||||
|
||||
| 参数 | 类型 | 默认值 | 说明 |
|
||||
|------|------|--------|------|
|
||||
| `--store-id` | int | — | 门店 ID |
|
||||
| `--tasks` | str | — | 任务列表,逗号分隔(传统模式) |
|
||||
| `--dry-run` | flag | `false` | 试运行,不提交数据库事务 |
|
||||
|
||||
### 管道与模式参数
|
||||
|
||||
| 参数 | 类型 | 默认值 | 说明 |
|
||||
|------|------|--------|------|
|
||||
| `--pipeline` | choice | — | 管道类型(见[管道类型](#管道类型)) |
|
||||
| `--processing-mode` | choice | `increment_only` | 处理模式(见[处理模式](#处理模式)) |
|
||||
| `--data-source` | choice | `hybrid` | 数据源模式(见[数据源模式](#数据源模式)) |
|
||||
| `--fetch-before-verify` | flag | `false` | 校验前先从 API 获取数据(仅 `verify_only`) |
|
||||
| `--verify-tables` | str | — | 仅校验指定表(逗号分隔) |
|
||||
|
||||
### 时间窗口参数
|
||||
|
||||
| 参数 | 类型 | 默认值 | 说明 |
|
||||
|------|------|--------|------|
|
||||
| `--window-start` | datetime | — | 固定时间窗口开始(优先级高于游标) |
|
||||
| `--window-end` | datetime | — | 固定时间窗口结束 |
|
||||
| `--force-window-override` | flag | `false` | 强制使用 window_start/window_end,不走 MAX(fetched_at) 兜底 |
|
||||
| `--window-split` | choice | `none` | 时间窗口切分:`none` / `day` / `week` / `month` |
|
||||
| `--window-split-unit` | str | 配置值 | 窗口切分单位(`day`/`week`/`month`/`none`) |
|
||||
| `--window-split-days` | int | 配置值 | 按天切分的天数(`1`/`10`/`30`) |
|
||||
| `--window-compensation-hours` | int | 配置值 | 窗口前后补偿小时数 |
|
||||
| `--lookback-hours` | int | `24` | 回溯小时数 |
|
||||
| `--overlap-seconds` | int | `3600` | 冗余秒数(默认 1 小时) |
|
||||
|
||||
### 数据库参数
|
||||
|
||||
| 参数 | 类型 | 默认值 | 说明 |
|
||||
|------|------|--------|------|
|
||||
| `--pg-dsn` | str | — | PostgreSQL DSN 连接串 |
|
||||
| `--pg-host` | str | — | PostgreSQL 主机 |
|
||||
| `--pg-port` | int | — | PostgreSQL 端口 |
|
||||
| `--pg-name` | str | — | PostgreSQL 数据库名 |
|
||||
| `--pg-user` | str | — | PostgreSQL 用户名 |
|
||||
| `--pg-password` | str | — | PostgreSQL 密码 |
|
||||
|
||||
### API 参数
|
||||
|
||||
| 参数 | 类型 | 默认值 | 说明 |
|
||||
|------|------|--------|------|
|
||||
| `--api-base` | str | — | API 基础 URL |
|
||||
| `--api-token` | str | — | API 令牌(Bearer Token) |
|
||||
| `--api-timeout` | int | — | API 超时(秒) |
|
||||
| `--api-page-size` | int | — | 分页大小 |
|
||||
| `--api-retry-max` | int | — | API 重试最大次数 |
|
||||
|
||||
### 目录与运行参数
|
||||
|
||||
| 参数 | 类型 | 默认值 | 说明 |
|
||||
|------|------|--------|------|
|
||||
| `--export-root` | str | — | 导出根目录 |
|
||||
| `--log-root` | str | — | 日志根目录 |
|
||||
| `--fetch-root` | str | — | 抓取 JSON 输出根目录 |
|
||||
| `--ingest-source` | str | — | 本地清洗入库源目录 |
|
||||
| `--write-pretty-json` | flag | `false` | 抓取 JSON 美化输出 |
|
||||
| `--idle-start` | str | — | 闲时窗口开始(HH:MM) |
|
||||
| `--idle-end` | str | — | 闲时窗口结束(HH:MM) |
|
||||
| `--allow-empty-advance` | flag | `false` | 允许空结果推进窗口 |
|
||||
|
||||
### 已弃用参数
|
||||
|
||||
| 参数 | 替代方案 | 说明 |
|
||||
|------|----------|------|
|
||||
| `--pipeline-flow` | `--data-source` | `FULL` → `hybrid`,`FETCH_ONLY` → `online`,`INGEST_ONLY` → `offline` |
|
||||
|
||||
---
|
||||
|
||||
## 常见命令示例
|
||||
|
||||
```bash
|
||||
# 全流程 ETL(API 抓取 → ODS → DWD → DWS → INDEX)
|
||||
python -m cli.main --pipeline api_full --pg-dsn "$PG_DSN" --store-id 1 --api-token "$TOKEN"
|
||||
|
||||
# 仅抓取 ODS 数据
|
||||
python -m cli.main --pipeline api_ods --store-id 1
|
||||
|
||||
# ODS → DWD 清洗装载(不抓取 API)
|
||||
python -m cli.main --pipeline ods_dwd
|
||||
|
||||
# 仅执行 DWS 汇总
|
||||
python -m cli.main --pipeline dwd_dws
|
||||
|
||||
# 仅执行指数算法
|
||||
python -m cli.main --pipeline dwd_index
|
||||
|
||||
# 指定时间窗口
|
||||
python -m cli.main --pipeline api_ods --window-start "2026-02-01" --window-end "2026-02-02"
|
||||
|
||||
# 按天切分时间窗口
|
||||
python -m cli.main --pipeline api_ods --window-start "2026-01-01" --window-end "2026-02-01" --window-split day
|
||||
|
||||
# 传统模式:指定任务列表
|
||||
python -m cli.main --tasks ODS_PAYMENT,ODS_MEMBER,ODS_SETTLEMENT_RECORDS --store-id 1
|
||||
|
||||
# 校验并修复(跳过增量)
|
||||
python -m cli.main --pipeline api_full --processing-mode verify_only
|
||||
|
||||
# 校验前先从 API 获取数据
|
||||
python -m cli.main --pipeline api_full --processing-mode verify_only --fetch-before-verify
|
||||
|
||||
# 增量 + 校验
|
||||
python -m cli.main --pipeline api_full --processing-mode increment_verify
|
||||
|
||||
# 仅校验指定表
|
||||
python -m cli.main --pipeline api_full --processing-mode verify_only --verify-tables "dim_member,fact_payment"
|
||||
|
||||
# 试运行(不提交)
|
||||
python -m cli.main --dry-run --tasks DWD_LOAD_FROM_ODS
|
||||
|
||||
# Schema 初始化
|
||||
python -m cli.main --tasks INIT_ODS_SCHEMA,INIT_DWD_SCHEMA,INIT_DWS_SCHEMA
|
||||
|
||||
# 手动入库(离线模式)
|
||||
python -m cli.main --tasks MANUAL_INGEST --data-source offline --ingest-source ./data/json
|
||||
|
||||
# DWS 配置种子数据初始化
|
||||
python -m cli.main --tasks SEED_DWS_CONFIG
|
||||
|
||||
# 数据完整性校验
|
||||
python -m cli.main --tasks DATA_INTEGRITY_CHECK
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
> 最后更新日期:2026-02-14
|
||||
Reference in New Issue
Block a user