当前位置: 首页 > news >正文

吴恩达深度学习笔记(7)

误差分析:

你运行一个算法代替人类计算,但是没有达到人类的效果,需要手动检查算法中的错误,对模型的一些部分做相应调整,才能更好地提升分类的精度。如果不加分析去做,可能几个月的努力对于提升精度并没有作用。所以一个好的误差分析的流程就相当重要。

表现上限:关注改正一个误差能提高多少准确率

并行的错误分析

做一个表格,写出错误的类型,并对样本进行统计,计算错误类别的百分比,结果能给你提供参考,决定优先解决的问题

清理错误标签数据:

监督学习中,有输入数据和输出标签,当输出标签错误,首先应该考虑训练集的情况(其实深度学习对于训练集中的随机错误很稳健,但对系统误差(本身标记的错误,而不是分类器错误)不稳健),随机误差造成的错误对算法结果影响很小。

如果决定研究开发集手动重新检查标签,并且尝试纠正,现需要考虑额外的指南和原则:

  • 同时应用开发集和测试集
  • 检查算法预测准确和错误的例子,看那些需要被纠正的,有时即使预测对了,但仍需要被纠正,如果只纠正预测错的,评估算法错误率的时候,就会有更大的偏差
  • 研究开发集和测试集,去纠正标签,可能应用同样的方法到训练集上,也可能不,因为纠正训练集不是那么重要,同时,开发集和测试集需要保持同分布,但是训练集稍微i不同也是很合理的

训练和测试的不同分布:

如果想扩大训练样本,但是只有数据分布不同的数据,应该将这部分数据放入训练集。开发集和测试集用的是满足目标分布的数据

不匹配数据分布的偏差和方差:

偏差和方差能确定下一步工作的优先级,当训练、开发、测试集来自不同的分布时,偏差和方差的分析方法也会发生变化。
假如人类在某个问题上有近乎完美表现,即贝叶斯误差约等于0,进行误差分析时要兼顾训练集和开发集误差

如果训练集和开发集不同分布,从训练集误差到开发集误差有两个事情变了

  • 算法看到的数据只有训练集没有开发集
  • 俩个集合不同分布

新建立一个子集:训练-开发集---从训练集随机抽取一部分混淆,区分上述两个事情对误差的影响

数据不匹配解决方法:

  • 进行人工误差分析,尝试去了解训练集和开发测试集的具体差异在哪里。
  • 尝试把训练数据变得更像开发集,或者收集更多的类似开发集和测试集的数据,如增加噪音;

迁移学习:


可以将在一个任务的神经网络中学到的东西应用到另一个任务(预训练、微调)

迁移学习什么时候有用:当在被迁移的模型中有大量的数据,而目标模型数据较少时

参考:吴恩达Coursera深度学习课程 DeepLearning.ai 提炼笔记(3-2)-- 机器学习策略(2)_deeplearning ai 笔记 3-2-CSDN博客

http://www.lryc.cn/news/463167.html

相关文章:

  • 二、数据离线处理场景化解决方案
  • 算法题总结(十四)——贪心算法(上)
  • hive on tez 指定队列后任务一直处于running状态
  • 闲说视频清晰度和各种格式、编码技术的发展历史
  • 嵌入式职业规划
  • Nginx - 实现 TCP/DUP流量的按 IP 动态转发
  • 基于深度学习的进化神经网络设计
  • 软考-软件设计师(10)-专业英语词汇汇总与新技术知识点
  • PyTorch 2.5 发布带来一些新特性和改进
  • 算法:560.和为k的子数组
  • C++之list(2)
  • React Componet类组件详解(老项目)
  • 位运算题目-Java实现-LeetCode题解:判断字符是否唯一-丢失的数字-两整数之和-只出现一次的数字 II-消失的两个数字
  • 复合泊松过程
  • [week1] newstar ctf ezAndroidStudy
  • TCP——Socket
  • OpenStack服务Swift重启失效(已解决)
  • System.Text.Json类库进行json转化时ValueKind:Object问题
  • 免费Excel工作表同类数据合并工具
  • 如何在算家云搭建Video-Infinity(视频生成)
  • LeetCode搜索插入位置
  • UE5学习笔记24-添加武器弹药
  • 限制游客在wordpress某分类下阅读文章的数量
  • Oracle云主机申请和使用教程:从注册到SSH连接的全过程
  • 芯知识 | NVH-FLASH语音芯片支持平台做语音—打造音频IC技术革新
  • 机器学习——解释性AI与可解释性机器学习
  • 中国全国省市区县汇总全国省市区json省市区数据2024最新
  • [Linux#67][IP] 报头详解 | 网络划分 | CIDR无类别 | DHCP动态分配 | NAT转发 | 路由器
  • 路由器原理和静态路由配置
  • UE5 使用Animation Budget Allocator优化角色动画性能