当前位置: 首页 > news >正文

数据挖掘概览

数据挖掘(Data Mining)就是从大量的,不完全的,有噪声的,模糊的,随机的实际应用数据中,提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识的过程.

预测性数据挖掘

分类

定义:分类就是把一些新的数据项映射到给定类别中的某一个类别

分类流程:①特征提取

                  ②特征选择

                  ③分类

常用的分类方法:

  • 决策树
  • 贝叶斯分类
  • 神经网络
  • 支持向量机(SVM)
  • K近邻分类(KNN)
  • CART算法
  • ID3算法
  • C4.算法

分类与聚类的最大区别在于,分类数据中的一部分的类别是已知的,而聚类数据的类别未知。

回归

应用现有的数值来预测其他数值是什么.

描述性数据挖掘

聚类

聚类的目的是把数据对象分成各个聚类,各个蔟.

关联分析

帮助识别数据库中数值之间的关系

关联规则(Association rule):指从事务数据库、关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。

关联分析(Association analysis):用于发现隐藏在大型数据集中的令人感兴趣的联系。所发现的联系可以用关联规则或者频繁项集的形式表示。关联规则挖掘就是从大量的数据中挖掘出描述数据项之间相互联系的有价值的有关知识。

关联规则分类

1)基于规则中处理的变量的类别,关联规则可以分为布尔型和数值型。


 2)基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。

3)基于规则中涉及到的数据的维数,关联规则可以分为单维的和多维的。

http://www.lryc.cn/news/385188.html

相关文章:

  • 【学习】软件测试中常见的文档类型及其作用
  • electron的托盘Tray
  • Harmony OS UI框架探索笔记
  • transformers evaluate
  • 【ONLYOFFICE深度探索】:ONLYOFFICE桌面编辑器8.1震撼发布,打造高效办公新境界
  • C++系统相关操作4 - 获取CPU(指令集)架构类型
  • whisper 实现语音转文字
  • 使用VLLM部署llama3量化版
  • 计算机缺失OpenCL.dll怎么办,OpenCL.dll丢失的多种解决方法
  • git 本地代码管理
  • Docker(九)-Docker运行redis6.0.8容器实例
  • 似然 与 概率
  • Tableau数据可视化与仪表盘搭建
  • web前端——HTML
  • C++的模板(九):模板的实例化问题
  • Clickhouse Projection
  • 放烟花短视频素材去哪里找?去哪里下载?烟花素材网分享
  • 爬虫笔记14——爬取网页数据写入MongoDB数据库,以爱奇艺为例
  • Jenkins教程-10-发送飞书测试报告通知
  • Swift开发——简单App设计
  • Python操作mysql
  • 监控易产品升级动态:V7.6.6.15版本全面升级
  • Vue3 + Element-plus + TS —— 动态表格自由编辑
  • 虚拟机配置桥接模式
  • 星戈瑞DSPE-SS-PEG-CY7近红外花菁染料
  • LeetCode:503. 下一个更大元素 II(Java 单调栈)
  • 代码重构:解读重构概念及重构实战
  • java.util.Optional类介绍
  • PhotoShop自动生成号码牌文件
  • 02逻辑代数与硬件描述语言基础