当前位置: 首页 > news >正文

数据可视化02-PCA降维

一、PCA

PCA做什么?找坐标系。

目标?二维降到一维,信息保留最多。

怎么样最好?数据分布最分散的方向(方差最大),作为主成分(坐标轴)。

二、怎么找主成分?

PC1的确定:每个点的 b^{2} 之和最小,c^{2} 之和最大。

PC2的确定:过原点,且与PC1垂直。

PCA降维的核心思想是:用少数几个最重要的方向(主成分PC1)来表示数据,而不是用所有方向。

为什么可以降噪?

  1. 舍弃次要方向: 噪声(偏离的点)通常分布在次要方向(如PC2)上,降维时舍弃这些方向,相当于过滤了一部分噪声。

  2. 压缩噪声的影响: 即使噪声点在PC1上仍有偏离,它们的偏离程度比在原始数据中要小。

三、特征值与特征向量

(一)特征向量

简单来说,特征向量定义了新的坐标轴的方向

(二)特征值

特征值表示了每个主成分在数据集中的方差贡献率

(三)碎石图

http://www.lryc.cn/news/544569.html

相关文章:

  • 大连指令数据集的创建--数据收集与预处理_02
  • xr-frame 3D Marker识别,扬州古牌坊 3D识别技术稳定调研
  • 【网络安全 | 漏洞挖掘】利用文件上传功能的 IDOR 和 XSS 劫持会话
  • 达梦数据库系列之安装及Mysql数据迁移
  • FS800DTU联动OneNET平台数据可视化View
  • ffmpeg avdevice_register_all 注册设备的作用
  • 使用JS遍历JSON数组
  • Go基于协程池的延迟任务调度器
  • k8S通过代理将集群外的中间件引入集群内访问 —— 筑梦之路
  • Linux 第三次脚本作业
  • 使用通义万相Wan2.1进行视频生成
  • AI技术为旅行社打开新流量入口
  • SuperMap iClient3D for WebGL 影像数据可视范围控制
  • API网关相关知识点
  • Opencv 图像形态学操作
  • Readability.js 与 Newspaper提取网页内容和元数据
  • 小程序Three Dof识别 实现景区AR体验
  • 腾讯2025年软件测试面试题
  • SSL域名证书怎么续期?
  • Grok3使用体验与模型版本对比分析
  • 《算法宝典:全类型题目索引》
  • Windows 11 部署 GPUStack 运行 DeepSeek
  • LangChain教程 - RAG - PDF问答
  • Windows 图形显示驱动开发-WDDM 3.2-自动显示切换(十二)
  • 《当齐天大圣踏入3A游戏世界:黑神话·悟空的破壁传奇》:此文为AI自动生成
  • Graphics View画一个可调速的风机(pyqt)
  • 基于django图书信息管理系统的搭建(增删改查)
  • Python 编程题 第四节:斐波那契数列、列表的复制、暂停后输出、成绩评级、统计字符
  • 【华为OD机考】华为OD笔试真题解析(15)--异常的打卡记录
  • 跟我学C++中级篇——定时器的设计