Files
Neo-ZQYY/docs/audit/prompt_logs/prompt_log_20260216_200327.md

926 B
Raw Permalink Blame History

  • [P20260216-200327] 2026-02-16 20:03:27 +0800
    • summary: 几个问题,帮我输出和整理:- 现在是默认 run.snapshot_missing_delete=True 么?- 实际上从代码看,当前大多数任务把 include_fetched_at 设为 False、include_record_in…
    • prompt:
几个问题,帮我输出和整理:- 现在是默认  run.snapshot_missing_delete=True 么?- 实际上从代码看,当前大多数任务把 include_fetched_at 设为 False、include_record_index 设为 True、include_site_column 设为 False冲突列用 ("source_file", "record_index")。这说明当前的去重策略主要靠 source_file + record_index 组合而非 content_hash。 每个任务,对应的参数帮我表格列举。- 从哪抓、怎么解析、写到哪、怎么去重、怎么处理删除 这个也使我关心的。那么,现在用通俗的解释,从这几个方面,说明下 feiqiu 的 ETL 现状。