当前位置: 首页 > news >正文

机器学习概述

  • 机器学习是人工智能的核心研究领域之一,其研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。

目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”。由于“经验在计算机系统中主要是以数据的形式存在的,因此机器学习需要运用机器学习技术对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一,并且为此而受到越来越多的关注。

与数据挖掘的区别与联系

所谓数据挖掘就是:“识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程”。顾名思义,数据挖掘就是试图从海量数据中找出有用的知识

可见,数据挖掘的教材和课程主要讲解各种不同的数据挖掘任务。比如:分类、回归、聚类、关联分析、异常分析、演变分析等等。

数据挖掘可以视为机器学习和数据库的交叉,它主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。

二者既有区别又有联系,整体来说,机器学习偏理论,数据挖掘偏应用

现在我们来看看分类的定义。分类就是构建一个分类模型,即分类器,然后通过分类器将数据对象映射到某个给定的类别中的过程。分类过程可以分为两步:

  1. 使用已知类标记的训练数据集学习分类模型。这一步称为分类器的训练阶段。

  1. 应用分类模型对未知类标记的对象进行分类。这一步称为分类器的工作阶段。实际上,在工作之前还又学到的模型进行性能测试评估(这一步称为分类器的测试阶段),如果模型的性能可以接受,才可以用它来对未知类标记的对象进行分类。

可见分类是一个三步走的过程:训练--测试--工作

分类的基本过程

分类:定义与过程

http://www.lryc.cn/news/22845.html

相关文章:

  • 企业网站自动生成系统的设计和实现
  • sikuli+eclipse对于安卓app自动化测试的应用
  • react源码分析:babel如何解析jsx
  • 搜广推 WideDeep 与 DeepCrossNetwork (DCN) - 记忆+泛化共存
  • 项目管理工具dhtmlxGantt甘特图入门教程(十四):导出/导入 Excel到 iCal
  • k-means聚类总结
  • char * 和const char *的区别
  • 【剑指offer】JZ3 数组中重复的数字、 JZ4 二维数组中的查找
  • 数据采集 - 笔记
  • 8年测开经验面试28K公司后,吐血整理出高频面试题和答案
  • spring读取properties顺序,重复key问题
  • 什么是api接口?(基本介绍)
  • 【2023全网最全教程】从0到1开发自动化测试框架(建议收藏)
  • 3-5天炒股短线战法指标思想结合----超级短线源码无未来
  • 原始GAN-pytorch-生成MNIST数据集(代码)
  • 注意,这些地区已发布2023年上半年软考报名时间
  • Html引入外部css <link>标签 @import
  • React源码分析8-状态更新的优先级机制
  • 如何在ChatGPT的API中支持多轮对话
  • 华为OD机试模拟题 用 C++ 实现 - 猜字谜(2023.Q1)
  • Containerd容器运行时将会替换Docker?
  • java虚拟机中对象创建过程
  • 3485. 最大异或和
  • SpringBoot:SpringBoot配置文件.properties、.yml 和 .ymal(2)
  • QT 学习之QPA
  • Pytorch中FLOPs和Params计算
  • DP1621国产LCD驱动芯片兼容替代HT1621B
  • Linux 用户管理
  • 前端vue面试题(持续更新中)
  • Java查漏补缺-从入门到精通汇总