当前位置: 首页 > news >正文

python 数据挖掘库orange3 介绍

orange3 是一个非常适合初学者的data mining library. 它让使用者通过拖拽内置的组件来形成工作流。让你不需要写任何代码就可以体验到数据挖掘和可视化的魅力。

它的桌面如下,这里我创建了 3 个节点,分别是数据集、小提琴图,散点图
在这里插入图片描述

其中 Datasets 是从 左边的 Data 组件库中拖拽过来的,Datasets 是 orange3 内置的数据集,比如非常常用的iris(鸢尾花) 数据集。双击桌面上的 Datasets 就能选择不同的数据集来作为下一步的数据来源。
数据集
点击左下角的预览按钮,可以像 excel 一样预览这个数据集

可视化

先看一下散点图, x 轴选择了 sepal(花萼长度), y轴是 花的类别,可以看出,相关性并不是很强,有很大一段x 轴的区域,三种类别都有可能。

在这里插入图片描述
我们换一个 x 轴,选择 petal length (花瓣长度),发现相关性很大,基本上很容易区分开
在这里插入图片描述

小提琴图

小提琴图主要表现的是某个特征的分布情况。下图表现了三种花的 petal length 分布,可以看出蓝色的 Iris-setosa 分布的比较集中,而且与其他的类别没有重叠。
这意味着,当你看看到一株 petal length(花瓣长度) 小于2.5的时候,几乎可以断定它属于setosa属

有趣的是,至于花萼(sepal)的宽度,setosa属比起其它属看起来却趋向于长尾分布(小提琴更窄),说明它的分布范围随机性更大。
在这里插入图片描述
再看一个热力图
请添加图片描述
可以看出三种花(x轴的三个颜色) 中,y 轴是四个属性, Iris-setosa 的petal length 这个属性明显和其它两种有区别,可以作为一个直观的区分属性。

http://www.lryc.cn/news/217581.html

相关文章:

  • Android和JNI交互 : 常见的图像格式转换 : NV21、RGBA、Bitmap等
  • AndroidAuto 解决连接手机启动AA屏闪一下问题
  • jbase实现业务脚本化
  • 【安全】Java幂等性校验解决重复点击(6种实现方式)
  • 基于设深度学习的人脸性别年龄识别系统 计算机竞赛
  • 0001Java安卓程序设计-基于Android多餐厅点餐桌号后厨前台服务设计与开发
  • Node.js 中解析 HTML 的方法介绍
  • 软件开发项目文档系列之十如何撰写测试用例
  • AI:53-基于机器学习的字母识别
  • 实习记录--(海量数据如何判重?)--每天都要保持学习状态和专注的状态啊!!!---你的未来值得你去奋斗
  • 【MATLAB源码-第67期】基于麻雀搜索算法(SSA)的无人机三维地图路径规划,输出最短路径和适应度曲线。
  • Promise的并发控制 - 从普通并发池到动态并发池
  • Java类加载机制(类加载器,双亲委派模型,热部署示例)
  • 【C语言初学者周冲刺计划】3.2将一个数组中的值逆序重新存放
  • 【C++心愿便利店】No.11---C++之string语法指南
  • OpenCV检测圆(Python版本)
  • 轻量封装WebGPU渲染系统示例<15>- DrawInstance批量绘制(源码)
  • E: 仓库 “http://cn.archive.ubuntu.com/ubuntu kinetic Release” 没有 Release 文件。
  • 【VR开发】【Unity】【VRTK】3-VR项目设置
  • git log 用法
  • Linux学习---有关监控系统zabbix的感悟
  • apollo云实验:定速巡航场景仿真调试
  • 基于RK3568的新能源储能能量管理系统ems
  • dockerfile避坑笔记(VMWare下使用Ubuntu在Ubuntu20.04基础镜像下docker打包多个go项目)
  • Qt 使用QtXlsx操作Excel表
  • canal+es+kibana+springboot
  • 【力扣】面试经典150题——双指针
  • 6-8 最宽层次结点数 分数 10
  • Linux学习第28天:Platform设备驱动开发(二): 专注与分散
  • postgresql数组重叠(有共同元素)查询