当前位置: 首页 > news >正文

[Python] scikit-learn中数据集模块介绍和使用案例

sklearn.datasets模块介绍

在scikit-learn中,可以使用sklearn.datasets模块中的函数来构建数据集。这个模块提供了用于加载和生成数据集的函数。

API Reference — scikit-learn 1.4.0 documentation

以下是一些常用的sklearn.datasets模块中的函数

load_iris()

sklearn.datasets.load_iris — scikit-learn 1.4.0 documentation

加载鸢尾花数据集,返回一个Bunch对象,包含特征数据和标签。

from sklearn import datasetsiris = datasets.load_iris()
X = iris.data  # 特征数据
y = iris.target  # 标签

load_digits()

sklearn.datasets.load_digits — scikit-learn 1.4.0 documentation

加载手写数字数据集,返回一个Bunch对象,包含特征数据和标签。

from sklearn import datasetsdigits = datasets.load_digits()
X = digits.data  # 特征数据
y = digits.target  # 标签

make_regression()

sklearn.datasets.make_regression — scikit-learn 1.4.0 documentation

生成一个回归问题的合成数据集,可以指定样本数、特征数、噪声等参数。

from sklearn.datasets import make_regression
X, y = make_regression(n_samples=5, n_features=2, noise=1, random_state=42)
X
y

make_classification()

sklearn.datasets.make_classification — scikit-learn 1.4.0 documentation

生成一个分类问题的合成数据集,可以指定样本数、特征数、类别数、噪声等参数。

from sklearn.datasets import make_classification
X, y = make_classification(random_state=42)
print(X.shape)
print(y.shape)
print(list(X[:5]))
print(list(y[:5]))

make_blobs()

sklearn.datasets.make_blobs — scikit-learn 1.4.0 documentation

可以用于生成一个多类别的合成数据集。它主要用于聚类算法的演示和测试。

from sklearn.datasets import make_blobs
X, y = make_blobs(n_samples=10, centers=3, n_features=2,random_state=0)
print(X.shape)
y
X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2,random_state=0)
print(X.shape)
y

小结

这些函数都会返回一个包含特征数据和标签的Bunch对象,你可以通过访问Bunch对象的属性来获取特征数据和标签。

另外,sklearn.datasets模块还提供了其他一些函数,可以加载和生成其他类型的数据集,例如回归数据集、聚类数据集等。

http://www.lryc.cn/news/293896.html

相关文章:

  • Qt-互斥量-临界区-QMutex-QMutexLocker-QReadWriteLock
  • 《PCI Express体系结构导读》随记 —— 第II篇 第4章 PCIe总线概述(6)
  • uniapp 高德地图显示
  • 2024年最新幻兽帕鲁服务器搭建教程
  • 重新配置vue项目时出现的:连接已断开问题
  • 四、Redis之配置文件
  • libevent源码解析--event,event_callback,event_base
  • C语言进阶之文件操作
  • 互联网摸鱼日报(2024-02-02)
  • 2024美赛C题:网球中的动量
  • 20.HarmonyOS App(JAVA)表格布局Layout使用方法
  • Android使用ScrollView导致鼠标点击事件无效
  • 【开源】SpringBoot框架开发大学计算机课程管理平台
  • Mac Shift切换输入法 - shift切换中英文 - Karabiner-Elements
  • 智慧港口:山海鲸可视化引领未来
  • Linux 网络编程 + 笔记
  • 顺序表应用3:元素位置互换之移位算法
  • Luogu P6066 [USACO05JAN] Watchcow S 题解 欧拉回路
  • 计算机网络_1.6.3 计算机网络体系结构分层思想举例
  • 图论练习1
  • canvas设置图形各种混合模式,类似photoshop效果
  • 谷粒商城-P19
  • Vue3入门到实战笔记02
  • CDN高防IP:技术解析与相关问题解答
  • 【React】react组件传参
  • Vue/html中点击复制到剪贴板
  • MtfLive直播导航PHP源码,附带系统搭建教程
  • day19 初始HTML
  • 从编程中理解:退一步海阔天空
  • 【前沿技术杂谈:开源软件】引领技术创新与商业模式的革命