当前位置: 首页 > news >正文

『大模型笔记』主成分分析(PCA)解释:简化机器学习中的复杂数据!

主成分分析(PCA)解释:简化机器学习中的复杂数据

文章目录

  • 一. 主成分分析(PCA)解释:简化机器学习中的复杂数据!
  • 二. 参考文献

一. 主成分分析(PCA)解释:简化机器学习中的复杂数据!

在这里插入图片描述

主成分分析(Principal Component Analysis,简称PCA)通过 将大型数据集中的维度减少到能够保留大部分原始信息的主成分,从而减少数据的维度

让我给你举个例子,说明为什么这很重要。假设在一个风险管理的场景中,我们想要了解哪些贷款彼此相似,以便理解哪些类型的贷款通常会还清,哪些类型的贷款风险较高。请看这张表,显示了六笔贷款的数据。这些贷款包含多个维度,例如贷款金额、申请人的信用评分等。虽然这里只显示了四个维度,但贷款实际上包含更多的维度。例如,借款人的年龄和收入债务比也是重要维度。

PCA是一种找出最重要维度或主成分的方法。直观上讲,我们知道在考虑风险时,有些维度比其他维度更重要。例如,信用评分可能比借款人在当前工作中的工作年限更重要。如果我们去除这些不重要或不太重要的维度,我们会看到两个主要好处:一是机器学习的训练和推理速度会更快,因为要处理的数据更少,维度更少;其次,如果只有两个维度࿰

http://www.lryc.cn/news/372660.html

相关文章:

  • springboot与flowable(5):任务分配(表达式)
  • 如何使用CCS9.3打开CCS3.0工程
  • Stable Diffusion 3 Medium 模型
  • 数据分析------统计学知识点(五)
  • Superset二次开发之Git篇 git remote
  • 记录一下PHP使用微信小程序支付
  • 【数据结构初阶】 --- 单链表
  • 并发、多线程、HTTP连接数有何关系?
  • 鸿蒙轻内核Kconfig使用笔记
  • react 0至1 案例
  • 基于MCU平台的HMI开发的性能优化与实战(上)
  • 【Tkinter界面】Canvas 图形绘制(02/5)
  • 1_常见指令【Linux中常见30个指令的学习和使用】【万字长文】
  • 每日复盘-202406014
  • JavaScript 深拷贝和浅拷贝的实现、使用场景和存在的问题
  • 8个常用的辅助函数!!
  • 服务器数据恢复—OceanStor存储中NAS卷数据丢失如何恢复数据?
  • 54.Python-web框架-Django-免费模板django-datta-able
  • XP系统安装Node.js v8.6.0并搭建Vue2开发环境(项目兼容到Vista的IE9浏览器)
  • redis序列化
  • IOT-Tree 1.7.0实现了一个类似Node-Red的流程功能
  • nc网络收发测试-tcp客户端\TCP服务器\UDP\UDP广播
  • 程序员该有怎么样的职业素养
  • 51交通灯
  • 鸿蒙Arkts上传图片并获取接口返回信息
  • 超文本标记语言(HTML)简介
  • 使用thymeleaf直接渲染字符串
  • Spring Boot整合发送QQ邮箱功能
  • Milvus向量数据库
  • python cls的使用