Files
ccdi/doc/modules/02-项目工作台/02.1-数据管理.md
2026-01-27 17:09:32 +08:00

144 lines
5.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 02.1-数据管理
## 模块概述
数据管理是项目工作台的核心模块之一,用于统一接入来自行内流水、征信数据、人工上传等不同来源和格式的数据,并自动化检查识别数据问题,保证后续风险识别的准确性。
## 模块结构
```
数据管理
├── 数据导入
└── 数据质量检查
```
## 功能分解
### 1.1 数据导入
**功能描述**: 提供多种数据源的导入功能,支持行内数据拉取和外部数据上传。
**功能点**:
- **拉取本行信息**: 输入证件号码或导入身份证号表格,自动拉取行内流水、资产等数据信息
- **他行流水导入**: 批量上传员工的他行银行、支付宝微信等交易流水文件支持Excel、文本型PDF系统自动解析提取交易金额、对手方、交易时间、余额、摘要等关键字段
- **征信信息导入**: 上传个人信用报告HTML格式系统自动解析提取信贷账户、负债总额、担保信息、查询记录等核心数据
- **员工家庭关系导入**: 上传员工的家庭成员信息,用于构建关系人图谱和关联分析
- **名单库选择**: 从"信息维护-中介库管理"内的名单中选择确认后的可疑名单
- **生成报告**: 生成初核结果,跳转至结果页
**数据要素**:
- 证件号码/身份证号
- 本行流水数据
- 他行流水文件
- 征信报告文件
- 员工家庭关系信息
- 名单库数据
### 1.2 数据质量检查
**功能描述**: 在数据导入后,系统自动执行预定义的质量规则对数据集进行检查。
**功能点**:
- **质量规则执行**: 自动执行数据质量检查规则
- **检查结果展示**: 以列表形式展示发现的具体问题
- 数据格式不一致(如日期格式不统一、金额单位混杂)
- 余额链条性异常(相邻交易记录间的余额计算逻辑断裂)
- 缺失关键字段(如交易记录缺少对手方账号或户名)
- **质量评分仪表盘**: 通过三个关键指标量化数据质量
- 数据完整性(衡量必填字段的填充率)
- 格式一致性(衡量数据遵循预定格式规范的程度)
- 余额连续性(衡量流水数据中余额连续、计算正确的程度)
**数据要素**:
- 数据完整性评分
- 格式一致性评分
- 余额连续性评分
- 异常记录详情
## 数据模型
### 数据导入记录 (DataImport)
| 字段名 | 类型 | 说明 | 必填 |
|-------|------|------|-----|
| importId | Long | 导入ID | 是 |
| projectId | Long | 项目ID | 是 |
| importType | String | 导入类型(本行/他行/征信/家庭关系) | 是 |
| importTime | DateTime | 导入时间 | 是 |
| importStatus | String | 导入状态 | 是 |
| fileCount | Integer | 文件数量 | 否 |
| recordCount | Integer | 记录数量 | 否 |
### 数据质量检查结果 (DataQualityCheck)
| 字段名 | 类型 | 说明 | 必填 |
|-------|------|------|-----|
| checkId | Long | 检查ID | 是 |
| projectId | Long | 项目ID | 是 |
| completenessScore | Double | 数据完整性评分 | 是 |
| consistencyScore | Double | 格式一致性评分 | 是 |
| continuityScore | Double | 余额连续性评分 | 是 |
| formatIssueCount | Integer | 格式不一致数量 | 是 |
| balanceIssueCount | Integer | 余额链条性异常数量 | 是 |
| missingFieldCount | Integer | 缺失关键字段数量 | 是 |
| checkTime | DateTime | 检查时间 | 是 |
## 支持的文件格式
| 数据类型 | 支持格式 | 解析方式 |
|---------|---------|---------|
| 他行流水 | Excel、文本型PDF | 自动解析 |
| 征信报告 | HTML | 自动解析 |
| 身份证号表格 | Excel | 导入读取 |
| 员工家庭关系 | Excel | 导入读取 |
## 业务规则
1. **数据导入顺序**: 建议先拉取本行信息,再导入他行流水和征信信息
2. **质量检查触发**: 数据导入完成后自动触发质量检查
3. **质量评分计算**:
- 数据完整性 = (已填充必填字段数 / 应填必填字段数) × 100%
- 格式一致性 = (格式正确记录数 / 总记录数) × 100%
- 余额连续性 = (余额计算正确记录数 / 总记录数) × 100%
4. **异常数据处理**: 发现异常需要用户确认后才能生成报告
## 页面原型
### 1. 数据导入页面
- 数据源选择区
- 文件上传区
- 导入进度展示
### 2. 数据质量检查页面
- 质量评分仪表盘
- 异常记录列表
- 异常详情展示
## 交互关系
| 关联模块 | 交互说明 |
|---------|---------|
| 初核结果总览 | 点击"生成报告"跳转到初核结果总览页 |
| 信息维护模块 | 从"中介库管理"选择名单 |
| 专项排查 | 导入的数据用于专项排查分析 |
## 异常处理
| 异常类型 | 处理方式 |
|---------|---------|
| 文件格式不支持 | 提示用户支持的格式,拒绝导入 |
| 数据解析失败 | 记录失败原因,提示用户检查文件 |
| 质量检查失败 | 展示异常详情,允许用户修正后重新导入 |
| 余额计算异常 | 标注异常记录,提示数据可能缺失或被篡改 |
## 功能点统计
- 二级功能: 2个
- 三级功能点: 10个
## 版本信息
- **文档版本**: V1.0
- **创建日期**: 2026-01-27
- **基于原文档**: 纪检初核系统功能说明书V1.0 第73-118行