当前位置: 首页 > news >正文

数据集——鸢尾花介绍和使用

文章目录

  • 一、鸢尾花数据集内容
  • 二、使用中常转换DataFrame

一、鸢尾花数据集内容

from sklearn import svm, datasets
# 鸢尾花数据
iris = datasets.load_iris()
print(iris.data)
X = iris.data[:, :2] # 为便于绘图仅选择2个特征
y = iris.target

在这里插入图片描述
它包含了150个样本,每个样本有4个特征(花瓣的长度、花瓣的宽度、花萼的长度、花萼的宽度),以及样本所属的类别(三种不同的鸢尾花之一)。

iris.data是一个NumPy数组或者类似的数据结构,它包含了数据集中所有样本的特征。具体来说,iris.data的形状(shape)是(150, 4),意味着有150行(样本)和4列(特征)。

当你执行X = iris.data[:, :2]时,你正在执行一个切片操作来选取数据的一部分。这里的:是一个切片操作符,它表示选取该维度的所有元素。

  • iris.data[:, :2]中的第一个:表示选取所有行(所有的样本)。
  • 第二个:2表示选取每一行的前两个元素(即前两个特征),即花瓣的长度和花瓣的宽度。

X = iris.data[:, :2]的结果是一个新的数组X,它包含了原始数据集iris.data中所有样本的前两个特征,形状为(150, 2)。这样的操作通常用于特征选择,即只选取你认为对模型预测最有帮助的特征。

二、使用中常转换DataFrame

df = pd.DataFrame(iris.data, columns=iris.feature_names)

在这里插入图片描述

http://www.lryc.cn/news/412091.html

相关文章:

  • ElasticSearch第4篇(亿级中文数据量 ElasticSearch与Sphinx建索引速度、查询速度、并发性能、实测对比)
  • 过期知识:thinkphp5 使用migrate给现有的数据表新增表字段
  • 前端和Postman调用同一个接口,拿到的数据不一样
  • 1000W长连接,如何建立和维护?千万用户IM 架构设计
  • vulhub:Apache解析漏洞CVE-2017-15715
  • 开发中可能会面临的真实问题及处理流程
  • 个性化你的生产力工具:待办事项App定制指南
  • 本地部署持续集成工具Jenkins并配置公网地址实现远程自动化构建
  • 【数据结构】了解哈希表,解决哈希冲突,用Java模拟实现哈希桶
  • qt5 ui转python或C++文件
  • scp命令详解
  • 算法小白的进阶之路(力扣1~5)
  • 昇思25天学习打卡营第22天|MindSporeK基于Diffusion扩散模型学习- Diffusion与其他生成模型
  • 【C++版本】protobuf与gRPC
  • 要抓住国际白银现货行情 以下这几点需要注意
  • 【计算机毕业设计】​720图书馆智能选座系统
  • java面向对象重点总结
  • 1321:【例6.3】删数问题(Noip1994)
  • 使用 Python 中的 ELSER 进行Serverless 语义搜索:探索夏季奥运会历史
  • [HITCON 2017]SSRFme 1
  • 看不见的硝烟:中国网络安全三十年沉浮史
  • 3.7.物体检测算法
  • Spring源码解析(27)之AOP的核心对象创建过程2
  • 【题解】【数学】—— [CSP-J 2023] 小苹果
  • python实现微信聊天图片DAT文件还原
  • 栈与队列——1.有效的括号
  • C语言家教记录(二)
  • Cocos Creator2D游戏开发(10)-飞机大战(8)-计分和结束
  • 经验分享:大数据多头借贷风险对自身的不利影响?
  • OpenCV 图像处理 轮廓检测基本原理