当前位置: 首页 > news >正文

数据挖掘可以挖掘什么类型的模式?

一、挖掘频繁模式、关联和相关性

频繁模式(frequent pettern)是在数据中频繁出现的模式。

频繁项集一般是指频繁的在事务数据集中一起出现的商品的集合。

频繁出现的子序列,如顾客倾向于先买相机,再买内存卡这样的模式就是一个(频繁)序列模式。

子结构可能涉及不同的机构模式,如图、数或格。如果一个子结构频繁出现,则可称为(频繁)结构模式。

挖掘频繁模式可以发现数据中有趣的关联和相关性。

关联规则可分为单维关联规则和多维关联规则。

二、用于预测分析的分类与回归

分类是找出描述和区分数据类或概念的模型,以便能够使用模型预测类标号未知的对象的类标号。

分类和回归是有监督的学习方法。数据集分为训练集和测试集。

分类是预测类别的标号。

回归是建立连续值函数模型,即用来预测难以获得的数据值或缺失的数据。

两种方法可以成为数值预测和类标号预测。

三、聚类分析

聚类分析是一种无监督的学习方法。

聚类的特点是最大化类簇间的距离、最小化类簇内样本的距离。

四、离群点分析

大部分数据挖掘方法都将离群点视为噪声或异常而丢弃。

但在欺诈检测等应用中,离群点的出现则很重要。


参考文献:数据挖掘:概念与技术(原书第三版)

http://www.lryc.cn/news/413439.html

相关文章:

  • JAVA中的隐式参数this
  • ThreadLocal 使用和详解避坑
  • Python中使用类方法的返回值在其他方法中继续调用,return self进行链式调用
  • 基于IOT架构的数据采集监控平台!
  • 初见scikit-learn之基础教程
  • 基于STM32的嵌入式深度学习系统教程
  • hive udf去掉map中的一个或者多个key
  • 模型量化技术综述:揭示大型语言模型压缩的前沿技术
  • 一文掌握Prompt:万能框架+优化技巧+常用指标
  • Vue 常用组件间通信方式
  • NineData云原生智能数据管理平台新功能发布|2024年7月版
  • 验收测试:确保软件符合业务需求和合同要求
  • Qt | QChartView+QDateTimeAxis(日期和时间数据图表)+QPieSeries(饼图)
  • 用闲置的阿里云服务器使用 NPS 实现内网穿透
  • 一款免费开源绿色免安装的透明锁屏工具
  • 程序员保持健康的 10 个技巧
  • Java并发迷宫:同步的魔法与死锁的诅咒
  • CoderGuide
  • 链式二叉树
  • PHP高校迎新系统-计算机毕业设计源码08468
  • 泛微开发修炼之旅--41Ecology基于触发器实现增量数据同步(人员、部门、岗位、人员关系表、人岗关系表)
  • FVM安装及配置
  • [Git][认识Git]详细讲解
  • Win11系统Docker部署Blazor程序
  • C语言自定义类型结构体与位段超详解
  • JS中关于预编译的【关键知识点】总结
  • Elasticsearch 映射(mapping)
  • 开放式耳机更适合运动的时候使用?开放式耳机推荐指南
  • 食堂窗口自助点餐小程序的设计
  • 请说出路由传参和获取参数的三种方式