当前位置: 首页 > news >正文

【深度学习】3.损失函数的作用

损失函数的作用

image-20250120004225939

  • 假设把猫这张图片分成四个像素点,分别为:56、231、24、2(实际应该是三维的,因为还有颜色通道的维度,这里简化成二维)。

  • 像素点拿到以后,进行三分类,粉红色为第一组W1,绿色为第二组W2,灰色为第三组W3,即cat,dog,ship。对应权重W的三行四列矩阵,三代表三类,四代表每个类别有四个像素点。

  • 通过得分函数计算得分。(实际就是矩阵运算)

  • 结果保存于 f ( x ; W , b ) f(x;W,b) f(x;W,b)矩阵,可以得出不同类权重W对于此四个像素值计算的结果大小不同。

  • 这里暂时对大小无定义。

对W的其中一行说明,如第二行:1.5、1.3、2.1、0.0,其中2.1最大,也就是说明2.1这个位置对应的像素点即第三个像素点24对判断此图属于dog类最重要。0.0最小,说明第四个像素点2对判断这张图是dog不太重要。

对于第一行的负值(-0.5)来说,正值起到促进作用,故负值起到抑制作用。

那W矩阵是如何得到的?

W矩阵是优化而来的。一开始可以随机产生一个3×4的矩阵,其中元素都是随机值,上述就是随机值的例子。但我们不难发现,猫是负的分,狗和船是正的分,明明是一只猫,但得到的结果却是负分,继而错误的将图片判断为狗了。产生这种现象的原因不是x的问题,因为x属于输入数据,因此W存在问题,需要变化。

可以得出,神经网络在整个的生命周期当中实际上就是在做一件事:什么样的W能更适合于咱们的数据去做当前这个任务

因此,在得到随机W之后,需要通过优化不断改善W,就和不断学习一样。W作为决策很重要,b仅仅是微调。

image-20250120011358751


那上面这个W有多不好?

image-20250120011752637

损失函数既能做分类,也能做回归,做的事情很多,唯一的区别就是损失函数如何定义的。因此做不同任务就是损失函数不同而已。

image-20250120011907926

对于如上图例子,第一张图片car的得分最高,将猫的图片错误的判断成了车,因此做的不好。

怎么办?

image-20250120012653074

通过上述损失函数可以将好的测试变成接近于0的数值。

  • 第二列车的值最大判断的是正确的,因此通过计算得到0。
  • 第三列青蛙的判断为负值,就很离谱,因此损失函数计算出的值也很大。
http://www.lryc.cn/news/525743.html

相关文章:

  • 深入MapReduce——计算模型设计
  • 小黑日常积累:学习了CROSS APPLY字段,将sqlserver中字段通过分隔符拆分并统计
  • WebSocket知识点笔记(一)
  • 安宝特方案 | AR在供应链管理中的应用:提升效率与透明度
  • 基于Springboot + vue实现的美发门店管理系统
  • springboot中配置logback-spring.xml
  • 从63 秒到 0.482 秒:深入剖析 MySQL 分页查询优化
  • 细说机器学习算法之过拟合与欠拟合
  • C/C++ 虚函数
  • 【3GPP】【5G】注销流程(Deregistration procedures)
  • 【小游戏篇】三子棋游戏
  • 7-Zip Mark-of-the-Web绕过漏洞复现(CVE-2025-0411)
  • 2025年国产化推进.NET跨平台应用框架推荐
  • 关于ARM和汇编语言
  • 2024人工智能AI+制造业应用落地研究报告汇总PDF洞察(附原数据表)
  • QTableView和QTableWidget的关系与区别
  • Java导出通过Word模板导出docx文件并通过QQ邮箱发送
  • ESP8266 MQTT服务器+阿里云
  • css动画水球图
  • 【设计模式-行为型】状态模式
  • 2024.1.22 安全周报
  • idea修改模块名导致程序编译出错
  • root用户Linux银河麒麟服务器安装vnc服务
  • CentOS 7使用RPM安装MySQL
  • OpenCV imread函数读取图像__实例详解
  • 激光线扫相机无2D图像的标定方案
  • 【安当产品应用案例100集】034-安当KSP支持密评中存储数据的机密性和完整性
  • 08.七种排序算法实现(C语言)
  • Alibaba Spring Cloud 一 核心组件、特性
  • kafka学习笔记7 性能测试 —— 筑梦之路