当前位置: 首页 > news >正文

02.13:监督学习中的分类问题

今天首先学习了监督学习中的分类问题,跑了两个代码。现在学起来感觉机器学习有很多不同的定理建立了不同的分类器,也就是所谓不同的方法。具体的数学原理我不太清楚。然后不同的应用场景有一个最优的分类器。

30cf66bfa7754a4e9ac6ec05a55cb679.png

0b903bff9a754bba9480105929f34af6.png

 

值得一提的应该就是终于清晰的明白了精度,召回率和F1得分是什么意思。

现在摘抄如下:

假设数据集有100个样本,其中有82个样本是我们感兴趣的,现在想用分类器选出这82个样本。最终,分类器选出了73个样本,它认为都是我们感兴趣的。在这73个样本中,其实只有65个样本是我们感兴趣的,剩下的8个样本我们不感兴趣,是分类器分错了。

可以如下方法计算分类器的精度:

分类正确的样本数量=65

总分类样本数量=73 

精度=65/73=89.04%

召回率的计算过程如下: 

数据集中我们感兴趣的样本数量=82 

分类正确的样本数量=65 

召回率=65/82 = 79.26%

一个给力的机器学习模型需要同时具备良好的精度和召回率。这两个指标是二律背反的,一个指标达到100%,那么另一个指标就会非常差!我们需要保持两个指标能够同时处于合理高度。为了量化两个指标的均衡性,引入了F1得分指标,是精度和召回率的合成指标,实际上是精度和召回率的调和均值(harmonic mean): 

F1 得分=2×精度×召回率/(精度+召回率)

上面示例中F1得分的计算过程如下:

F1 得分=2×0.89×0.79/(0.89+0.79)=0.8370

 

还遇到了使用with open时对于子文件夹中的文件相对和绝对路径都无法访问到的问题。但是如果放到第一层文件夹中就可以。问题未知,后续继续学习。

 

今天学完了第二章,也不算学完了。感觉对于机器学习的认知已经稍微多了那么一点点,过去非得强调机器学习和深度学习的区别就是把它们当成了两个单独的个体。实际上,深度学习是机器学习的一个方向。而机器学习本身是根据不同的应用场景有多种不同的算法的。继续学习,继续深入。

http://www.lryc.cn/news/5957.html

相关文章:

  • leetcode刷题 | 关于二叉树的题型总结3
  • 设计模式-结构型
  • 【新】华为OD机试 - 预订酒店(Python)| 运气好 会考到原题
  • 【编程基础之Python】4、安装Python开发工具
  • 5. 最长回文子串
  • 内网渗透(二十四)之Windows协议认证和密码抓取-Mimikatz读取sam和lsass获取密码
  • 【THREE.JS】网页中的炫酷3D
  • Go语言之 下载安装go以及vscode配置go环境
  • RBAC权限 API声明四种kubernetes对象
  • CDGP仿真选择题4
  • 典型相关分析与R语言实现
  • 【蓝桥集训】第一天——前缀和
  • 2022-03-19青少年软件编程(C语言)等级考试试卷(六级)解析
  • [JavaScript 刷题] 特殊数组的特征值, leetcode 1608
  • 各种素材网站大全【全部倾倒,福利倒计时-JS,HTML,游戏素材,UI,图片素材等
  • 影片自由,丝滑流畅,Docker容器基于WebDav协议通过Alist挂载(百度网盘/阿里云盘)Python3.10接入
  • 【新】华为OD机试 - 数组的中心位置(Python)| 运气好,这就是原题
  • 小米电视安装 Plex 打造家庭影院
  • Elasticsearch:Combined fields 查询
  • uart 子系统
  • SpringBoot 整合EasyExcel详解
  • VScode+cuda编程:常见环境问题
  • 简单实用的内网穿透实现教程
  • makefile案例学习
  • MySQL性能优化六 事物隔离级别与锁机制
  • 四数之和-力扣18-java排序+双指针
  • 操作系统开发:BIOS/MBR基础与调试
  • 华为OD机试真题JAVA实现【数组合并】真题+解题思路+代码(20222023)
  • 说说Real DOM和Virtual DOM的区别?优缺点?
  • 使用脚本以可读的 JSON 格式显示 curl 命令输出