当前位置: 首页 > news >正文

机器学习第一课

1.背景

有监督学习:有标签(连续变量(回归问题:时间序列等)、分类变量(分类))

无监督学习:没有标签(聚类、关联(相关性分析:哪些相关,看特征))

半监督学习:少量标签(分类标签(分类、聚类))

强化学习:(标签为分类变量(分类)或者没有标签(控制))

步骤:

过程:

机器训练过程:训练数据—>输入到程序算法中,根据输出得到的模型—>目标变量,通过调整程序,再到程序算法中

得到算法的实际精度:测试数据—>输入到程序算法中,输出—>目标变量与实际样本对比得到精度。

目标变量值为标签

监督学习(有标签)

无监督学习(没有标签)聚类分析

半监督学习(部分标签)有标签+无标签 经过训练得到模型,再检验所有数据

目标函数:

交叉验证

划分数据集,在训练集上训练模型,在测试集上验证结果,根据验证结果调参数(但不科学)

Validation set  验证集   Test set 测试集

大部分实验只分了训练集和测试集没有去分验证集这个说法大家都是在训练集上去训练,测试集上去调参(公平对比)

总数据中的部分,分出来,进行验证看拟合效果,因为预测未知数据,无法判断预测效果的好

10折交叉验证\5折交叉

时间序列,划分多段

学习率Learning rate ,正则化参数 ,层数,维度, epoch迭代次数(防止过拟合)

目标变量和特征都是机器学习中的重要概念,它们在模型训练和预测中有着不同的作用。

目标变量(Target Variable)指的是我们希望预测或分类的变量。也可以称为因变量(Dependent Variable)。在监督学习中,我们需要根据一组已知的特征数据来预测目标变量的值,目标变量可以是连续的数值型变量,也可以是离散的分类型变量。

特征(Feature)则是指模型用来做出预测的输入变量。也可以称为自变量(Independent Variable)。在监督学习中,我们使用一组特征来预测目标变量的值。特征可以是连续的数值型变量,也可以是离散的分类型变量,还可以是其他类型的变量,例如文本、图像等。

可以这样理解:目标变量是我们预测的结果或输出,而特征是我们用来进行预测的输入。例如,我们想要根据房屋的大小、位置、卧室数量等特征来预测房价,那么房价就是目标变量,而房屋的大小、位置、卧室数量就是特征。

在机器学习模型训练中,我们通常会将目标变量和特征分别作为训练数据的输出和输入。我们使用已知的特征和目标变量来训练模型,然后使用该模型对新的特征数据进行预测,从而得到预测结果。

http://www.lryc.cn/news/421057.html

相关文章:

  • C语言典型例题32
  • 第二十五天学习笔记2024.8.9
  • sqlserver将一张表导出成txt
  • YOLOv8+DeepSort实现
  • 「链表」链表原地算法合集:原地翻转|原地删除|原地取中|原地查重 / LeetCode 206|237|2095|287(C++)
  • 【STM32】SPI通信和RTC实时时钟
  • DAMA学习笔记(十三)-大数据和数据科学
  • 【Java】Java 中的 toLowerCase() 方法详解
  • Linux: 进程概念详解
  • 【C++】模板详细讲解(含反向迭代器)
  • haproxy七层代理详解之-完整安装部署流程及负载均衡实现-及热更新方法
  • C++11 bind
  • LeetCode199 二叉树的右视图
  • 数据赋能(172)——开发:数据挖掘——影响因素、直接作用、主要特征
  • Vue:Vue3-TypeScript-Pinia-Vite-pnpm / 基础项目 / 20240807
  • windows Qt 录屏 录音
  • AAC中的ADTS格式分析
  • iOS内存管理---MRC vs ARC
  • 【数学分析笔记】第1章第1节:集合(2)
  • 大话设计模式:七大设计原则
  • 利用多商家AI智能名片小程序提升消费者参与度与个性化体验:重塑零售行业的忠诚策略
  • Scala 闭包
  • 前端JS总结(中)
  • elasticsearch的match_phrase匹配及其可能导致的查询问题
  • C++快速理解之继承
  • Node.JS - 基础(Express)
  • I/O复用
  • 【验证可用】解决安装SQL Server数据库时,报错“启用 windows 功能 NetFx3 时出错,错误代码:-2146498298......“的问题
  • STM32的SDIO接口详解
  • docker容器常用指令,dockerfile