# 02.1-数据管理 ## 模块概述 数据管理是项目工作台的核心模块之一,用于统一接入来自行内流水、征信数据、人工上传等不同来源和格式的数据,并自动化检查识别数据问题,保证后续风险识别的准确性。 ## 模块结构 ``` 数据管理 ├── 数据导入 └── 数据质量检查 ``` ## 功能分解 ### 1.1 数据导入 **功能描述**: 提供多种数据源的导入功能,支持行内数据拉取和外部数据上传。 **功能点**: - **拉取本行信息**: 输入证件号码或导入身份证号表格,自动拉取行内流水、资产等数据信息 - **他行流水导入**: 批量上传员工的他行银行、支付宝微信等交易流水文件,支持Excel、文本型PDF,系统自动解析提取交易金额、对手方、交易时间、余额、摘要等关键字段 - **征信信息导入**: 上传个人信用报告(HTML格式),系统自动解析提取信贷账户、负债总额、担保信息、查询记录等核心数据 - **员工家庭关系导入**: 上传员工的家庭成员信息,用于构建关系人图谱和关联分析 - **名单库选择**: 从"信息维护-中介库管理"内的名单中选择确认后的可疑名单 - **生成报告**: 生成初核结果,跳转至结果页 **数据要素**: - 证件号码/身份证号 - 本行流水数据 - 他行流水文件 - 征信报告文件 - 员工家庭关系信息 - 名单库数据 ### 1.2 数据质量检查 **功能描述**: 在数据导入后,系统自动执行预定义的质量规则对数据集进行检查。 **功能点**: - **质量规则执行**: 自动执行数据质量检查规则 - **检查结果展示**: 以列表形式展示发现的具体问题 - 数据格式不一致(如日期格式不统一、金额单位混杂) - 余额链条性异常(相邻交易记录间的余额计算逻辑断裂) - 缺失关键字段(如交易记录缺少对手方账号或户名) - **质量评分仪表盘**: 通过三个关键指标量化数据质量 - 数据完整性(衡量必填字段的填充率) - 格式一致性(衡量数据遵循预定格式规范的程度) - 余额连续性(衡量流水数据中余额连续、计算正确的程度) **数据要素**: - 数据完整性评分 - 格式一致性评分 - 余额连续性评分 - 异常记录详情 ## 数据模型 ### 数据导入记录 (DataImport) | 字段名 | 类型 | 说明 | 必填 | |-------|------|------|-----| | importId | Long | 导入ID | 是 | | projectId | Long | 项目ID | 是 | | importType | String | 导入类型(本行/他行/征信/家庭关系) | 是 | | importTime | DateTime | 导入时间 | 是 | | importStatus | String | 导入状态 | 是 | | fileCount | Integer | 文件数量 | 否 | | recordCount | Integer | 记录数量 | 否 | ### 数据质量检查结果 (DataQualityCheck) | 字段名 | 类型 | 说明 | 必填 | |-------|------|------|-----| | checkId | Long | 检查ID | 是 | | projectId | Long | 项目ID | 是 | | completenessScore | Double | 数据完整性评分 | 是 | | consistencyScore | Double | 格式一致性评分 | 是 | | continuityScore | Double | 余额连续性评分 | 是 | | formatIssueCount | Integer | 格式不一致数量 | 是 | | balanceIssueCount | Integer | 余额链条性异常数量 | 是 | | missingFieldCount | Integer | 缺失关键字段数量 | 是 | | checkTime | DateTime | 检查时间 | 是 | ## 支持的文件格式 | 数据类型 | 支持格式 | 解析方式 | |---------|---------|---------| | 他行流水 | Excel、文本型PDF | 自动解析 | | 征信报告 | HTML | 自动解析 | | 身份证号表格 | Excel | 导入读取 | | 员工家庭关系 | Excel | 导入读取 | ## 业务规则 1. **数据导入顺序**: 建议先拉取本行信息,再导入他行流水和征信信息 2. **质量检查触发**: 数据导入完成后自动触发质量检查 3. **质量评分计算**: - 数据完整性 = (已填充必填字段数 / 应填必填字段数) × 100% - 格式一致性 = (格式正确记录数 / 总记录数) × 100% - 余额连续性 = (余额计算正确记录数 / 总记录数) × 100% 4. **异常数据处理**: 发现异常需要用户确认后才能生成报告 ## 页面原型 ### 1. 数据导入页面 - 数据源选择区 - 文件上传区 - 导入进度展示 ### 2. 数据质量检查页面 - 质量评分仪表盘 - 异常记录列表 - 异常详情展示 ## 交互关系 | 关联模块 | 交互说明 | |---------|---------| | 初核结果总览 | 点击"生成报告"跳转到初核结果总览页 | | 信息维护模块 | 从"中介库管理"选择名单 | | 专项排查 | 导入的数据用于专项排查分析 | ## 异常处理 | 异常类型 | 处理方式 | |---------|---------| | 文件格式不支持 | 提示用户支持的格式,拒绝导入 | | 数据解析失败 | 记录失败原因,提示用户检查文件 | | 质量检查失败 | 展示异常详情,允许用户修正后重新导入 | | 余额计算异常 | 标注异常记录,提示数据可能缺失或被篡改 | ## 功能点统计 - 二级功能: 2个 - 三级功能点: 10个 ## 版本信息 - **文档版本**: V1.0 - **创建日期**: 2026-01-27 - **基于原文档**: 纪检初核系统功能说明书V1.0 第73-118行