当前位置: 首页 > news >正文

【数据挖掘】银行信用卡风险大数据分析与挖掘

银行信用卡风险大数据分析与挖掘

1、实验目的

中国某个商业银行高层发现自家信用卡存在严重的欺诈和拖欠现象,已经影响到自身经营和发展。银行高层希望大数据分析部门采用数据挖掘技术,对影响用户信用等级的主要因素进行分析,结合信用卡用户的人口特征属性对欺诈行为和拖欠行为的影响因素进行分析,挖掘银行客户信用卡记录数据的潜在价值,为该银行的信用卡业务决策提供参考。银行大数据部门通过对银行的客户信用记录、申请客户信息、拖欠历史信息、消费历史记录等数据进行分析,可对不同程度的客户进行归类,研究信用卡贷款拖欠、信用卡欺诈等问题与客户的个人信息、信用卡使用信息的关系,为银行提前识别、防控信用卡业务风险提供参考,从而减少银行在信用卡业务方面的损失,并采用大数据分析与挖掘模型和算法设计构建信用卡风险识别系统,为银行的智慧运营奠定基础。本次分析的主要目的是通过对客户拖欠历史信息和消费记录进行信用卡风险客户识别模型的建立。

2、实验环境

实验环境采用的是R4.3.1版本,环境编程工具采用的是RStudio进行编程建立预测模型并评估模型的效果,对模型进行参数优化,得出响应的模型结果。

3、实验设计

3.1、题目设计

信用卡风险客户识别模型。通过对该应该用户是否有拖欠行为和欺诈行为的用户作为该银行的信用卡风险客户,制定风险客户标签。

3.2、数据获取与存储

采用R语言对原始数据进行读取,读取后的数据采用变量进行保存在R工作环境中,以便建模分析调取使用。由于数据文件为excel形式,因此利用R读取数据时采用readxl包中的read_excel函数进行数据的读取。

3.3、数据处理

在读取数据后需要对数据做处理,而由于需要用到不同的表格数据,需要先将不同表格数据通过关联的客户号进行连接后,建立目标变量是否风险客户,是否风险客户是通过是否有拖欠行为和是否欺诈行为判断,两者只要满足其一则为风险客户。建立好目标变量后需要对无用变量进行剔除,如客户姓名、客户号等对建模无用的基础信息进行剔除。剔除无用变量后发现数据中的变量有分部为类别变量,因此需要对类别变量的数据类型做转换,将是否类型或有无类型的变量采用0和1进行复制替换处理,有序类别变量则采用序列号赋值处理,无序类别变量则将其转换为因子的数据类型,最后得到模型的原始数据,再对原始数据进行训练集和测试集的划分,以便利用训练集和测试集分别进行模型的建立和模型的测试。

3.4、模型与参数确定

建立模型所选用的算法分别为逻辑斯蒂回

http://www.lryc.cn/news/396022.html

相关文章:

  • 使用 Qt 和 ECharts 进行数据可视化
  • 【机器学习】在【Pycharm】中的实践教程:使用【逻辑回归模型】进行【乳腺癌检测】
  • 【搭建Nacos服务】centos7 docker从0搭建Nacos服务
  • 将 build.gradle 配置从 Groovy 迁移到 Kotlin
  • 5G(NR) NTN 卫星组网架构
  • WEB安全-文件上传漏洞
  • Python函数 之 函数基础
  • 昇思25天学习打卡营第11天|SSD目标检测
  • MySQL篇五:基本查询
  • FreeBSD@ThinkPad x250因电池耗尽关机后无法启动的问题存档
  • pdfplumber vs PyMuPDF:PDF文本、图像和表格识别的比较
  • 深入Django系列
  • 【Python】找Excel重复行
  • 重读AI金典算法模型-GPT系列
  • 仙人掌中的SNMP检测不到服务器
  • git只列出本地分支
  • 算力狂飙|WAIC 2024上的服务器
  • uniapp app端跳转第三方app(高德地图/百度地图为例)
  • 阿里云RDS云数据库库表恢复操作
  • 来一场栈的大模拟(主要是单调栈)
  • 13 - matlab m_map地学绘图工具基础函数 - 介绍创建管理颜色映射的函数m_colmap和轮廓图绘制颜色条的函数m_contfbar
  • PTA - 编写函数计算圆面积
  • Golang | Leetcode Golang题解之第218题天际线问题
  • 【Mars3d】osgb倾斜摄影模型加载慢卡顿的优化方案参考
  • 认识同源策略
  • ADOQuery 查询MSSQL存储过程一个莫名其妙的错误;
  • 变阻器的分类
  • 微服务节流阀:Eureka中服务限流策略的精妙实现
  • Keras实战之图像分类识别
  • Celery,一个实时处理的 Python 分布式系统