当前位置：首页 > news >正文

数据集——鸢尾花介绍和使用

news 2025/7/10 13:41:50

文章目录

一、鸢尾花数据集内容
二、使用中常转换DataFrame

一、鸢尾花数据集内容

from sklearn import svm, datasets
# 鸢尾花数据
iris = datasets.load_iris()
print(iris.data)
X = iris.data[:, :2] # 为便于绘图仅选择2个特征
y = iris.target

在这里插入图片描述
它包含了150个样本，每个样本有4个特征（花瓣的长度、花瓣的宽度、花萼的长度、花萼的宽度），以及样本所属的类别（三种不同的鸢尾花之一）。

iris.data是一个NumPy数组或者类似的数据结构，它包含了数据集中所有样本的特征。具体来说，iris.data的形状（shape）是(150, 4)，意味着有150行（样本）和4列（特征）。

当你执行X = iris.data[:, :2]时，你正在执行一个切片操作来选取数据的一部分。这里的:是一个切片操作符，它表示选取该维度的所有元素。

iris.data[:, :2]中的第一个:表示选取所有行（所有的样本）。
第二个:2表示选取每一行的前两个元素（即前两个特征），即花瓣的长度和花瓣的宽度。

X = iris.data[:, :2]的结果是一个新的数组X，它包含了原始数据集iris.data中所有样本的前两个特征，形状为(150, 2)。这样的操作通常用于特征选择，即只选取你认为对模型预测最有帮助的特征。

二、使用中常转换DataFrame

df = pd.DataFrame(iris.data, columns=iris.feature_names)

在这里插入图片描述

http://www.lryc.cn/news/412091.html

相关文章：

ElasticSearch第4篇（亿级中文数据量 ElasticSearch与Sphinx建索引速度、查询速度、并发性能、实测对比）

过期知识:thinkphp5 使用migrate给现有的数据表新增表字段

前端和Postman调用同一个接口，拿到的数据不一样

1000W长连接，如何建立和维护？千万用户IM 架构设计

vulhub：Apache解析漏洞CVE-2017-15715

开发中可能会面临的真实问题及处理流程

个性化你的生产力工具：待办事项App定制指南

本地部署持续集成工具Jenkins并配置公网地址实现远程自动化构建

【数据结构】了解哈希表，解决哈希冲突，用Java模拟实现哈希桶

qt5 ui转python或C++文件

scp命令详解

算法小白的进阶之路（力扣1~5）

昇思25天学习打卡营第22天|MindSporeK基于Diffusion扩散模型学习- Diffusion与其他生成模型

【C++版本】protobuf与gRPC

要抓住国际白银现货行情以下这几点需要注意

【计算机毕业设计】720图书馆智能选座系统

java面向对象重点总结

1321：【例6.3】删数问题(Noip1994)

使用 Python 中的 ELSER 进行Serverless 语义搜索：探索夏季奥运会历史

[HITCON 2017]SSRFme 1

看不见的硝烟：中国网络安全三十年沉浮史

3.7.物体检测算法

Spring源码解析(27)之AOP的核心对象创建过程2

【题解】【数学】—— [CSP-J 2023] 小苹果

python实现微信聊天图片DAT文件还原

栈与队列——1.有效的括号

C语言家教记录（二）

Cocos Creator2D游戏开发(10)-飞机大战(8)-计分和结束

经验分享：大数据多头借贷风险对自身的不利影响？

OpenCV 图像处理轮廓检测基本原理