当前位置: 首页 > news >正文

机器学习 | 机器学习基础知识

一、机器学习是什么

        计算机从数据中学习规律并改善自身进行预测的过程。


二、数据集

1、最常用的公开数据集

2、结构化数据与非结构化数据


三、任务地图

1、分类任务 Classification

  • 已知样本特征
  • 判断样本类别
  • 二分类、多分类、多标签分类

        二分类:垃圾邮件分类、图像识别等

                

        多分类问题:鸢尾花分类问题

        多标签分类问题:标签间不互斥,概率和不为1        

        

2、回归任务 Regression

  • 线性回归
  • 多项式回归:一个因变量,一个或多个自变量。
  • 任何函数都可以用多项式逼近。
  • 逻辑回归:实际是分类,简单可并行,细节很多
    • 类似二分类,但求法不同


 三、机器学习的分类

 根据有没有老师 ~

1、监督学习 Supervised Learning

        分类和回归

        训练数据有标记

2、无监督学习 Unsupervised Learning

         训练数据未经标记

        聚类 —— K均值算法 K-means、密度聚类 DBSCAN、最大期望算法

        降维 —— 主成分分析 PCA、核方法

        关联规则学习 —— 挖掘特征间关联关系,Apriori方法、Eclat方法

                

3、半监督学习 Semi-supervised Learning

         少量标记学习,大量无标记数据

4、强化学习 Reinforcement Learning

        观测环境、估计状态、执行操作、获得回报或惩罚


 根据数据怎么用 ~

1、 批量学习 (Batch Learning)

        先训练再使用
        需要大量的时间和计算资源
        通常都是离线完成

2、在线学习

         


  根据模型怎么扩展 ~

1、基于实例的学习

        先记住训练实例,相似度计算

2、基于模型的学习

        先构建模型

http://www.lryc.cn/news/263199.html

相关文章:

  • OpenHarmony鸿蒙原生应用开发,ArkTS、ArkUI学习踩坑学习笔记,持续更新中。
  • RHCE8 资料整理(十)二
  • CUDA 学习记录2
  • 探索Qt 6.3:了解基本知识点和新特性
  • 持续集成交付CICD:基于 GitLabCI 与 JenkinsCD 实现后端项目发布
  • 一些好用的VSCode扩展
  • 3dsmax渲染太慢,用云渲染农场多少钱?
  • JVM-9-Class类文件的结构
  • Redis持久化,性能管理
  • linux(centos7)离线安装mysql-5.7.35-1.el7.x86_64.rpm-bundle.tar
  • 【lesson17】MySQL表的基本操作--表去重、聚合函数和group by
  • 面试题总结(十二)【Qt】【华清远见西安中心】
  • GPT-4V with Emotion:A Zero-shot Benchmark forMultimodal Emotion Understanding
  • CogVLM与CogAgent:开源视觉语言模型的新里程碑
  • CSS的盒子模型(重点)
  • 论文笔记:Bilinear Attention Networks
  • 2312llvm,01基本介绍
  • Spring之手写IoC
  • IDEA运行JSP启动后页面中文乱码
  • Python 自动化之收发邮件(二)
  • RHEL8_Linux_Ansible常用模块的使用
  • 2023 英特尔On技术创新大会直播 | AI 融合发展之旅
  • 【JavaWeb】往浏览器打印一个hello world
  • 技术探秘:在RISC Zero中验证FHE——由隐藏到证明:FHE验证的ZK路径(1)
  • Spring容器中scope为prototype类型Bean的回收机制
  • Python生成器(python系列25)
  • Vue项目搭建过程
  • 系统分析师(软考)知识点整理(一)
  • 2021年数维杯国际大学生数学建模D题2021年电影市场票房波动模型分析求解全过程文档及程序
  • Kubernetes 的用法和解析 -- 5