docs: 补充流水标签详细日志设计

This commit is contained in:
wkc
2026-03-17 14:33:13 +08:00
parent 2aef6701c2
commit b3ba6fd59d

View File

@@ -0,0 +1,412 @@
# 项目流水标签后端详细日志设计
## 概述
本次设计面向“项目流水标签”后端链路补充详细日志提醒能力,覆盖手动重算、自动触发、项目级互斥、规则级执行、参数解析、结果落库和自动补跑全过程。
目标同时满足两类需求:
- 排障:出现“没有触发”“任务卡住”“规则没执行”“结果为 0”“自动补跑未生效”等问题时能够通过日志快速定位断点
- 审计:能够追踪是谁在什么时间,对哪个项目、哪个模型发起了手动重算,以及本次重算的结果摘要
本次设计只补应用日志,不调整数据库表结构,不新增前端展示,不引入 AOP、链路追踪框架或独立审计表。
## 已确认范围
- 日志面向“排障 + 审计”双目标
- 日志保存位置沿用现有后端应用日志
- 记录手动重算与自动触发两类入口
- 记录项目级互斥、补跑标记、补跑消费过程
- 记录任务级摘要、规则级执行、结果清理和结果写入
- 记录规则参数解析来源和结果
- 阈值参数值允许打印
- 身份证号、账号、`objectKey` 等敏感字段不打印明文
- 不打印 SQL 明细
- 命中明细不按条展开到 `info`
## 现状问题
当前与流水标签相关的主要代码位于:
- `ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/CcdiBankTagServiceImpl.java`
- `ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/ProjectBankTagRebuildCoordinator.java`
- `ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/BankTagRuleConfigResolver.java`
- `ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/CcdiFileUploadServiceImpl.java`
现状上,“文件上传 / 拉取本行信息”链路已有较多日志,但“流水标签重算”核心链路日志不足,主要存在以下问题:
1. 手动重算和自动触发进入标签链路后,缺少统一入口日志
2. 项目级互斥和 `needRerun` 标记逻辑几乎不可观测
3. 标签任务开始、结束、失败都没有清晰摘要
4. 单条规则执行的耗时、命中数、阈值来源无法定位
5. 结果清理和批量写库缺少过程确认
这会导致问题发生时难以区分:
- 是入口未触发
- 是被项目级互斥拦截
- 是规则没有命中
- 是规则执行失败
- 是结果写库失败
- 是补跑标记了但未真正再次执行
## 方案对比
### 方案一:在现有方法中直接补日志
- 在现有类中按节点直接补 `info / debug / warn / error`
- 不做统一模板
优点:
- 改动最小
- 落地最快
- 与当前项目写法最接近
缺点:
- 日志字段格式容易分散
- 后续继续扩展时容易重复和漂移
### 方案二:统一字段格式的轻量日志设计
- 在现有类中补日志
- 统一核心上下文字段和文案结构
- 允许通过少量私有辅助方法减少重复
优点:
- 兼顾快速落地和长期可检索性
- 同时适合排障和审计
- 不引入额外框架,风险较低
缺点:
- 比方案一多一点整理成本
### 方案三:日志之外再做持久化审计摘要
- 除应用日志外,再把关键摘要落到任务表或独立审计表
优点:
- 审计能力最强
- 不依赖日志平台
缺点:
- 超出本次“补详细日志提醒”的范围
- 会引入表结构或数据模型变更
## 最终方案
采用方案二:统一字段格式的轻量日志设计。
具体原则如下:
1. 只在现有后端类补日志,不改数据库结构
2. `info` 负责任务摘要和关键里程碑
3. `debug` 负责规则参数、命中数量、批处理细节
4. `warn` 负责互斥、降级、参数缺失、无命中等非致命异常
5. `error` 负责任务失败、规则异常、写库失败、触发失败
6. 日志字段尽量统一,保证同一任务可以通过 `projectId/taskId` 串起来
## 日志等级设计
### info
用于记录:
- 手动重算入口
- 自动触发入口
- 获取项目锁成功
- 任务创建成功
- 规则加载完成
- 历史结果清理开始
- 单规则开始和结束摘要
- 结果批量写入摘要
- 任务成功摘要
- 自动补跑开始和结束
### debug
用于记录:
- 规则阈值参数
- 参数来源项目
- 规则命中明细数量
- 无需写库时的空结果分支
- 补跑标记消费细节
### warn
用于记录:
- 手动重算被运行中任务拒绝
- 自动触发命中运行中任务,仅标记 `needRerun`
- 自动触发被跳过
- 规则参数缺失
- 规则执行结果为空或无命中
### error
用于记录:
- 任务整体失败
- 单规则执行异常
- 结果写库异常
- 参数解析过程中出现不可恢复异常
- 自动触发或补跑异常
## 统一上下文字段
建议所有流水标签日志尽量带上以下字段:
- `projectId`
- `taskId`
- `modelCode`
- `triggerType`
- `operator`
- `ruleCode`
- `costMs`
- `hitCount`
其中:
- 任务创建前无法取得 `taskId` 的场景允许缺省
- 与单规则无关的日志可以不打印 `ruleCode`
- 与耗时无关的日志可以不打印 `costMs`
## 脱敏规则
本次日志遵循以下脱敏边界:
- 允许打印阈值参数编码和值
- 不打印身份证号明文
- 不打印账号明文
- 不打印完整 `objectKey`
- 不打印规则 SQL
- 不在 `info` 级别展开逐条命中结果
若后续需要定位对象级命中,可在 `debug` 级别打印脱敏后的对象标识摘要,例如前 3 位加后 2 位,但本次设计不要求默认展开。
## 打点设计
### 1. 入口层
涉及类:
- `CcdiBankTagController`
- `CcdiFileUploadServiceImpl`
目标:
- 明确日志是从手动入口还是自动入口进入
- 对自动触发链路补“已触发 / 已跳过”判断
建议日志:
```text
【流水标签】收到手动重算请求: projectId={}, modelCode={}, operator={}
【流水标签】批处理完成,准备触发自动重算: projectId={}, triggerType={}, anySuccess={}
【流水标签】跳过自动重算: projectId={}, triggerType={}, reason=all_records_failed
```
### 2. 协调层
涉及类:
- `ProjectBankTagRebuildCoordinator`
目标:
- 观测项目级互斥
- 区分“任务丢失”和“任务被合并补跑”
- 记录锁获取、锁释放、补跑消费全过程
建议日志:
```text
【流水标签】手动重算开始排队: projectId={}, modelCode={}, operator={}
【流水标签】项目已有运行中任务,拒绝手动重算: projectId={}, modelCode={}, operator={}
【流水标签】项目正在重算,已标记完成后补跑: projectId={}, runningTaskId={}, triggerType={}
【流水标签】获取项目重算锁成功: projectId={}
【流水标签】检测到需要补跑,准备再次执行: projectId={}, previousTaskId={}
【流水标签】未检测到补跑标记,结束自动重算: projectId={}, taskId={}
【流水标签】释放项目重算锁: projectId={}
```
### 3. 执行层
涉及类:
- `CcdiBankTagServiceImpl`
目标:
- 形成任务级生命周期日志
- 形成规则级执行和写库摘要
建议日志:
```text
【流水标签】任务创建成功: taskId={}, projectId={}, modelCode={}, triggerType={}, operator={}
【流水标签】加载启用规则完成: taskId={}, projectId={}, modelCode={}, ruleCount={}
【流水标签】开始清理历史结果: taskId={}, projectId={}, modelCode={}
【流水标签】规则开始执行: taskId={}, projectId={}, ruleCode={}, resultType={}
【流水标签】规则执行参数: taskId={}, ruleCode={}, thresholds={}
【流水标签】规则执行完成: taskId={}, projectId={}, ruleCode={}, hitCount={}, costMs={}
【流水标签】规则无命中: taskId={}, projectId={}, ruleCode={}, costMs={}
【流水标签】批量写入标签结果: taskId={}, projectId={}, resultCount={}
【流水标签】任务执行成功: taskId={}, projectId={}, modelCode={}, triggerType={}, ruleCount={}, hitCount={}, costMs={}
【流水标签】任务执行失败: taskId={}, projectId={}, modelCode={}, triggerType={}, error={}
```
### 4. 参数解析层
涉及类:
- `BankTagRuleConfigResolver`
目标:
- 说明阈值从项目默认配置还是项目专属配置解析而来
- 在参数缺失时明确记录缺了哪些编码
建议日志:
```text
【流水标签】解析规则参数: projectId={}, effectiveProjectId={}, ruleCode={}, requiredParams={}
【流水标签】规则参数解析结果: projectId={}, ruleCode={}, thresholdValues={}
【流水标签】规则参数缺失: projectId={}, ruleCode={}, missingParams={}
```
## 关键异常场景设计
### 手动重算被拒绝
当项目已经存在运行中任务时:
- 抛出原有业务异常
- 额外补 `warn`,明确项目、模型、操作人和拒绝原因
目的:
- 便于区分“接口未进来”和“接口进来了但被互斥挡住”
### 自动重算被合并
当批量上传或拉取本行触发自动重算时,如果项目已在运行中:
- 不再直接丢弃
- 通过 `markNeedRerun` 标记补跑
- 日志明确说明当前触发未丢失,而是等待本轮完成后自动重跑
### 参数缺失但继续执行
当前规则参数解析器未对所有缺失参数直接抛错,部分规则可能按空值或 `0` 继续执行。
此场景需要:
- `warn` 记录缺失参数编码
- `debug` 记录实际解析到的阈值集合
- 文案中说明本次按当前默认值继续执行
### 单规则执行失败
当某条规则在查询或结果构造过程中抛异常时:
- `error` 记录 `taskId/projectId/ruleCode`
- 保留原有失败传播语义
- 由任务级失败日志补充整任务摘要
### 结果写库失败
当历史结果已清理但新结果写入失败时:
- `error` 记录失败发生在“结果写入”阶段
- 日志中带上准备写入的结果条数
这样可以避免误判为“规则无命中”。
### 自动补跑消费
自动重算完成后如果检测到 `needRerun=1`
- `info` 记录上一轮任务 ID 和将进入补跑
- `debug` 记录补跑标记消费结果
如果没有检测到补跑标记,也应记录收尾日志,避免看到“开始”却看不到“结束”。
## 建议实现方式
为控制改动范围,本次不新增独立日志组件,优先采用以下实现策略:
1. 在相关类中直接补充结构统一的日志
2. 对重复字段较多的场景,可增加少量私有辅助方法拼接摘要
3. 不为了日志而引入 ThreadLocal、MDC、AOP 或统一切面
这样可以把改动集中在当前标签链路相关类中,降低回归风险。
## 验证策略
本次重点验证“行为分支可被覆盖”,不建议编写对日志文本本身高度耦合的脆弱断言。
建议关注以下测试:
### 协调器测试
- 已有运行中任务时,手动重算被拒绝
- 自动触发时命中运行中任务并标记 `needRerun`
- 自动触发完成后成功消费补跑标记
### 标签服务测试
- 启用规则数为 0
- 规则执行有命中且成功写库
- 规则执行无命中时不写库
- 单规则抛异常导致任务失败
### 参数解析测试
- 使用默认项目参数
- 使用项目专属参数
- 存在参数缺失时返回缺失状态
## 非目标
本次设计不包含以下内容:
- 新增数据库表或审计表
- 前端页面展示任务执行日志
- 接入链路追踪系统
- 打印规则 SQL
- 打印对象或账号明细
- 调整标签任务执行策略或线程池模型
## 预期效果
落地后,开发和运维应能够通过日志快速回答以下问题:
- 手动重算是否真正进入后端
- 自动触发是否提交成功,还是因为整批失败而跳过
- 项目当前是否被互斥锁住
- 自动触发是否被合并为补跑
- 本次任务创建了哪个 `taskId`
- 加载了多少条规则
- 哪条规则执行最慢、命中多少
- 参数是否来自默认配置,是否存在缺失
- 结果是否已删除旧数据并完成新写入
- 任务最终成功还是失败,失败在哪个阶段
## 落地范围
建议本次代码改动控制在以下文件附近:
- `ccdi-project/src/main/java/com/ruoyi/ccdi/project/controller/CcdiBankTagController.java`
- `ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/CcdiBankTagServiceImpl.java`
- `ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/ProjectBankTagRebuildCoordinator.java`
- `ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/BankTagRuleConfigResolver.java`
- `ccdi-project/src/main/java/com/ruoyi/ccdi/project/service/impl/CcdiFileUploadServiceImpl.java`
如需进一步实现,可在此设计基础上继续拆分为具体实现计划。