Files
ccdi/docs/design/2026-03-17-project-bank-statement-tagging-logging-design.md

12 KiB
Raw Permalink Blame History

项目流水标签后端详细日志设计

概述

本次设计面向“项目流水标签”后端链路补充详细日志提醒能力,覆盖手动重算、自动触发、项目级互斥、规则级执行、参数解析、结果落库和自动补跑全过程。

目标同时满足两类需求:

  • 排障:出现“没有触发”“任务卡住”“规则没执行”“结果为 0”“自动补跑未生效”等问题时能够通过日志快速定位断点
  • 审计:能够追踪是谁在什么时间,对哪个项目、哪个模型发起了手动重算,以及本次重算的结果摘要

本次设计只补应用日志,不调整数据库表结构,不新增前端展示,不引入 AOP、链路追踪框架或独立审计表。

已确认范围

  • 日志面向“排障 + 审计”双目标
  • 日志保存位置沿用现有后端应用日志
  • 记录手动重算与自动触发两类入口
  • 记录项目级互斥、补跑标记、补跑消费过程
  • 记录任务级摘要、规则级执行、结果清理和结果写入
  • 记录规则参数解析来源和结果
  • 阈值参数值允许打印
  • 身份证号、账号、objectKey 等敏感字段不打印明文
  • 不打印 SQL 明细
  • 命中明细不按条展开到 info

现状问题

当前与流水标签相关的主要代码位于:

  • ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/CcdiBankTagServiceImpl.java
  • ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/ProjectBankTagRebuildCoordinator.java
  • ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/BankTagRuleConfigResolver.java
  • ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/CcdiFileUploadServiceImpl.java

现状上,“文件上传 / 拉取本行信息”链路已有较多日志,但“流水标签重算”核心链路日志不足,主要存在以下问题:

  1. 手动重算和自动触发进入标签链路后,缺少统一入口日志
  2. 项目级互斥和 needRerun 标记逻辑几乎不可观测
  3. 标签任务开始、结束、失败都没有清晰摘要
  4. 单条规则执行的耗时、命中数、阈值来源无法定位
  5. 结果清理和批量写库缺少过程确认

这会导致问题发生时难以区分:

  • 是入口未触发
  • 是被项目级互斥拦截
  • 是规则没有命中
  • 是规则执行失败
  • 是结果写库失败
  • 是补跑标记了但未真正再次执行

方案对比

方案一:在现有方法中直接补日志

  • 在现有类中按节点直接补 info / debug / warn / error
  • 不做统一模板

优点:

  • 改动最小
  • 落地最快
  • 与当前项目写法最接近

缺点:

  • 日志字段格式容易分散
  • 后续继续扩展时容易重复和漂移

方案二:统一字段格式的轻量日志设计

  • 在现有类中补日志
  • 统一核心上下文字段和文案结构
  • 允许通过少量私有辅助方法减少重复

优点:

  • 兼顾快速落地和长期可检索性
  • 同时适合排障和审计
  • 不引入额外框架,风险较低

缺点:

  • 比方案一多一点整理成本

方案三:日志之外再做持久化审计摘要

  • 除应用日志外,再把关键摘要落到任务表或独立审计表

优点:

  • 审计能力最强
  • 不依赖日志平台

缺点:

  • 超出本次“补详细日志提醒”的范围
  • 会引入表结构或数据模型变更

最终方案

采用方案二:统一字段格式的轻量日志设计。

具体原则如下:

  1. 只在现有后端类补日志,不改数据库结构
  2. info 负责任务摘要和关键里程碑
  3. debug 负责规则参数、命中数量、批处理细节
  4. warn 负责互斥、降级、参数缺失、无命中等非致命异常
  5. error 负责任务失败、规则异常、写库失败、触发失败
  6. 日志字段尽量统一,保证同一任务可以通过 projectId/taskId 串起来

日志等级设计

info

用于记录:

  • 手动重算入口
  • 自动触发入口
  • 获取项目锁成功
  • 任务创建成功
  • 规则加载完成
  • 历史结果清理开始
  • 单规则开始和结束摘要
  • 结果批量写入摘要
  • 任务成功摘要
  • 自动补跑开始和结束

debug

用于记录:

  • 规则阈值参数
  • 参数来源项目
  • 规则命中明细数量
  • 无需写库时的空结果分支
  • 补跑标记消费细节

warn

用于记录:

  • 手动重算被运行中任务拒绝
  • 自动触发命中运行中任务,仅标记 needRerun
  • 自动触发被跳过
  • 规则参数缺失
  • 规则执行结果为空或无命中

error

用于记录:

  • 任务整体失败
  • 单规则执行异常
  • 结果写库异常
  • 参数解析过程中出现不可恢复异常
  • 自动触发或补跑异常

统一上下文字段

建议所有流水标签日志尽量带上以下字段:

  • projectId
  • taskId
  • modelCode
  • triggerType
  • operator
  • ruleCode
  • costMs
  • hitCount

其中:

  • 任务创建前无法取得 taskId 的场景允许缺省
  • 与单规则无关的日志可以不打印 ruleCode
  • 与耗时无关的日志可以不打印 costMs

脱敏规则

本次日志遵循以下脱敏边界:

  • 允许打印阈值参数编码和值
  • 不打印身份证号明文
  • 不打印账号明文
  • 不打印完整 objectKey
  • 不打印规则 SQL
  • 不在 info 级别展开逐条命中结果

若后续需要定位对象级命中,可在 debug 级别打印脱敏后的对象标识摘要,例如前 3 位加后 2 位,但本次设计不要求默认展开。

打点设计

1. 入口层

涉及类:

  • CcdiBankTagController
  • CcdiFileUploadServiceImpl

目标:

  • 明确日志是从手动入口还是自动入口进入
  • 对自动触发链路补“已触发 / 已跳过”判断

建议日志:

【流水标签】收到手动重算请求: projectId={}, modelCode={}, operator={}
【流水标签】批处理完成,准备触发自动重算: projectId={}, triggerType={}, anySuccess={}
【流水标签】跳过自动重算: projectId={}, triggerType={}, reason=all_records_failed

2. 协调层

涉及类:

  • ProjectBankTagRebuildCoordinator

目标:

  • 观测项目级互斥
  • 区分“任务丢失”和“任务被合并补跑”
  • 记录锁获取、锁释放、补跑消费全过程

建议日志:

【流水标签】手动重算开始排队: projectId={}, modelCode={}, operator={}
【流水标签】项目已有运行中任务,拒绝手动重算: projectId={}, modelCode={}, operator={}
【流水标签】项目正在重算,已标记完成后补跑: projectId={}, runningTaskId={}, triggerType={}
【流水标签】获取项目重算锁成功: projectId={}
【流水标签】检测到需要补跑,准备再次执行: projectId={}, previousTaskId={}
【流水标签】未检测到补跑标记,结束自动重算: projectId={}, taskId={}
【流水标签】释放项目重算锁: projectId={}

3. 执行层

涉及类:

  • CcdiBankTagServiceImpl

目标:

  • 形成任务级生命周期日志
  • 形成规则级执行和写库摘要

建议日志:

【流水标签】任务创建成功: taskId={}, projectId={}, modelCode={}, triggerType={}, operator={}
【流水标签】加载启用规则完成: taskId={}, projectId={}, modelCode={}, ruleCount={}
【流水标签】开始清理历史结果: taskId={}, projectId={}, modelCode={}
【流水标签】规则开始执行: taskId={}, projectId={}, ruleCode={}, resultType={}
【流水标签】规则执行参数: taskId={}, ruleCode={}, thresholds={}
【流水标签】规则执行完成: taskId={}, projectId={}, ruleCode={}, hitCount={}, costMs={}
【流水标签】规则无命中: taskId={}, projectId={}, ruleCode={}, costMs={}
【流水标签】批量写入标签结果: taskId={}, projectId={}, resultCount={}
【流水标签】任务执行成功: taskId={}, projectId={}, modelCode={}, triggerType={}, ruleCount={}, hitCount={}, costMs={}
【流水标签】任务执行失败: taskId={}, projectId={}, modelCode={}, triggerType={}, error={}

4. 参数解析层

涉及类:

  • BankTagRuleConfigResolver

目标:

  • 说明阈值从项目默认配置还是项目专属配置解析而来
  • 在参数缺失时明确记录缺了哪些编码

建议日志:

【流水标签】解析规则参数: projectId={}, effectiveProjectId={}, ruleCode={}, requiredParams={}
【流水标签】规则参数解析结果: projectId={}, ruleCode={}, thresholdValues={}
【流水标签】规则参数缺失: projectId={}, ruleCode={}, missingParams={}

关键异常场景设计

手动重算被拒绝

当项目已经存在运行中任务时:

  • 抛出原有业务异常
  • 额外补 warn,明确项目、模型、操作人和拒绝原因

目的:

  • 便于区分“接口未进来”和“接口进来了但被互斥挡住”

自动重算被合并

当批量上传或拉取本行触发自动重算时,如果项目已在运行中:

  • 不再直接丢弃
  • 通过 markNeedRerun 标记补跑
  • 日志明确说明当前触发未丢失,而是等待本轮完成后自动重跑

参数缺失但继续执行

当前规则参数解析器未对所有缺失参数直接抛错,部分规则可能按空值或 0 继续执行。

此场景需要:

  • warn 记录缺失参数编码
  • debug 记录实际解析到的阈值集合
  • 文案中说明本次按当前默认值继续执行

单规则执行失败

当某条规则在查询或结果构造过程中抛异常时:

  • error 记录 taskId/projectId/ruleCode
  • 保留原有失败传播语义
  • 由任务级失败日志补充整任务摘要

结果写库失败

当历史结果已清理但新结果写入失败时:

  • error 记录失败发生在“结果写入”阶段
  • 日志中带上准备写入的结果条数

这样可以避免误判为“规则无命中”。

自动补跑消费

自动重算完成后如果检测到 needRerun=1

  • info 记录上一轮任务 ID 和将进入补跑
  • debug 记录补跑标记消费结果

如果没有检测到补跑标记,也应记录收尾日志,避免看到“开始”却看不到“结束”。

建议实现方式

为控制改动范围,本次不新增独立日志组件,优先采用以下实现策略:

  1. 在相关类中直接补充结构统一的日志
  2. 对重复字段较多的场景,可增加少量私有辅助方法拼接摘要
  3. 不为了日志而引入 ThreadLocal、MDC、AOP 或统一切面

这样可以把改动集中在当前标签链路相关类中,降低回归风险。

验证策略

本次重点验证“行为分支可被覆盖”,不建议编写对日志文本本身高度耦合的脆弱断言。

建议关注以下测试:

协调器测试

  • 已有运行中任务时,手动重算被拒绝
  • 自动触发时命中运行中任务并标记 needRerun
  • 自动触发完成后成功消费补跑标记

标签服务测试

  • 启用规则数为 0
  • 规则执行有命中且成功写库
  • 规则执行无命中时不写库
  • 单规则抛异常导致任务失败

参数解析测试

  • 使用默认项目参数
  • 使用项目专属参数
  • 存在参数缺失时返回缺失状态

非目标

本次设计不包含以下内容:

  • 新增数据库表或审计表
  • 前端页面展示任务执行日志
  • 接入链路追踪系统
  • 打印规则 SQL
  • 打印对象或账号明细
  • 调整标签任务执行策略或线程池模型

预期效果

落地后,开发和运维应能够通过日志快速回答以下问题:

  • 手动重算是否真正进入后端
  • 自动触发是否提交成功,还是因为整批失败而跳过
  • 项目当前是否被互斥锁住
  • 自动触发是否被合并为补跑
  • 本次任务创建了哪个 taskId
  • 加载了多少条规则
  • 哪条规则执行最慢、命中多少
  • 参数是否来自默认配置,是否存在缺失
  • 结果是否已删除旧数据并完成新写入
  • 任务最终成功还是失败,失败在哪个阶段

落地范围

建议本次代码改动控制在以下文件附近:

  • ccdi-project/src/main/java/com/ruoyi/ccdi/project/controller/CcdiBankTagController.java
  • ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/CcdiBankTagServiceImpl.java
  • ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/ProjectBankTagRebuildCoordinator.java
  • ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/BankTagRuleConfigResolver.java
  • ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/CcdiFileUploadServiceImpl.java

如需进一步实现,可在此设计基础上继续拆分为具体实现计划。