当前位置: 首页 > news >正文

数据预处理

继续提取代码片段:

12. **导入iris数据集并查看前5行数据**:


    ```python
    from sklearn.datasets import load_iris
    iris = load_iris()
    X = iris.data
    print('iris数据集的维度为:', X.shape)
    print('iris数据集的前5行数据为:\n', X[:5])
    ```

13. **指定特征数的PCA降维并查看降维结果**:


    ```python
    from sklearn.decomposition import PCA
    pca_num = PCA(n_components=3)
    pca_num.fit(X)
    X_pcal = pca_num.transform(X)
    print('对iris数据集进行指定特征数的降维后的维度为:', X_pcal.shape)


    ```

14. **查看降维后的数据**:


    ```python
    print('进行指定特征数降维后, iris数据集的前5行数据为:\n', X_pcal[:5])


    ```

15. **查看原始特征与PCA主成分之间的关系**:


    ```python
    import numpy as np
    print('进行指定特征数的降维后的最大方差的成分:')
    for i in range(pca_num.components_.shape[0]):
        arr = np.around(pca_num.components_[i], 2)
        print('component({}): {}'.format(i+1, arr))
    ```

16. **查看降维后的各主成分的方差和方差百分比**:


    ```python
    var = np.around(pca_num.explained_variance_, 2)
    print('进行指定特征数的降维后的各主成分的方差为:', [x for x in var])
    var_ratio = np.round(pca_num.explained_variance_ratio_, 2)
    print('进行指定特征数的降维后的各主成分的方差百分比为:', [x for x in var_ratio])
    ```

17. **指定方差百分比的PCA降维**:


    ```python
    pca_per = PCA(n_components=0.95)
    pca_per.fit(X)
    X_pca2 = pca_per.transform(X)
    print('对iris数据集进行指定方差百分比的降维后的维度为:', X_pca2.shape)


    ```

18. **指定方差百分比降维后查看数据**:


    ```python
    print('进行指定方差百分比的降维后 iris数据集的前5行数据为:\n', X_pca2[:5])
    ```

19. **指定方差百分比降维后查看原始特征与PCA主成分之间的关系**:


    ```python
    print('进行指定方差百分比降维后的最大方差的成分:')
    for i in range(pca_per.components_.shape[0]):
        arr = np.around(pca_per.components_[i], 2)
        print('component({}): {}'.format(i+1, arr))
    ```

20. **指定方差百分比降维后查看各主成分的方差值和方差百分比**:


    ```python
    var = np.round(pca_per.explained_variance_, 2)
    print('进行指定方差百分比的降维后的各主成分的方差为:', [x for x in var])
    var_ratio = np.round(pca_per.explained_variance_ratio_, 2)
    print('进行指定方差百分比的降维后的各主成分的方差百分比为:', [x for x in var_ratio])
    ```

这些代码片段展示了如何使用Python进行数据预处理和降维处理,包括导入iris数据集、指定特征数的PCA降维、查看降维结果、分析原始特征与PCA主成分之间的关系,以及查看降维后的各主成分的方差和方差百分比。
 

http://www.lryc.cn/news/469368.html

相关文章:

  • django宠物领养管理系统-计算机毕业设计源码26858
  • 使用TeamViewer远程局域网内的两台电脑
  • GUI简介、Swing的常用组件、java程序的运行过程、class文件、JAR、runable_jar、双括号初始化
  • @Autowired和@Resource和getBean()区别
  • Merlion笔记(四):添加一个新的预测模型
  • 【论文阅读】ESRGAN
  • 电脑异常情况总结
  • [项目详解][boost搜索引擎#1] 概述 | 去标签 | 数据清洗 | scp
  • PL/I语言的起源?有C语言,有B语言和A语言吗?为什么shell脚本最开始可能有#!/bin/bash字样?为什么不支持嵌套注释?
  • gin入门教程(3):创建第一个 HTTP 服务器
  • Vue+ECharts+iView实现大数据可视化大屏模板
  • el-table 表格设置必填项
  • vivo 轩辕文件系统:AI 计算平台存储性能优化实践
  • Vue学习笔记(四)
  • 发送短信,验证码
  • 国内大语言模型哪家更好用?
  • OTP一次性密码、多因子认证笔记
  • 玉米生长阶段检测系统源码&数据集全套:改进yolo11-dysample
  • 【机器学习】决策树算法
  • P2818 天使的起誓
  • 数字信号处理实验简介
  • Flask-SQLAlchemy 组件
  • Could not retrieve mirrorlist http://mirrorlist.centos.org错误解决方法
  • 最新PHP网盘搜索引擎系统源码 附教程
  • SpringBoot面试热题
  • ASP.NET Core8.0学习笔记(二十三)——EF Core自引用
  • springboot童装销售管理系统-计算机毕业设计源码92685
  • OpenCV中的图像通道合并
  • Flutter TextField和Button组件开发登录页面案例
  • 【vue + mockjs】Mockjs——数据接口模拟