当前位置: 首页 > news >正文

什么是梯度下降

什么是梯度下降

根据已有数据的分布来预测可能的新数据,这是回归

请添加图片描述

希望有一条线将数据分割成不同类别,这是分类

请添加图片描述

无论回归还是分类,我们的目的都是让搭建好的模型尽可能的模拟已有的数据

请添加图片描述

除了模型的结构,决定模型能否模拟成功的关键是参数

请添加图片描述

只有几个参数是比较简单的,但是模型的参数经常能够达到成千上万,我们无一一法手动设定,需要机器自己手动去寻找,这个过程就是我们常说的学习或者训练,在训练过程中,我们通常会使用一个工具来帮助模型调整参数,这个工具就是损失函数。

什么是损失函数?

在训练开始之前,模型代表的分布与真实的分布之间会存在一定的差异,我们以一个函数去表示误差,我们以一个函数去表示误差,有时也被称为误差函数。既然损失函数代表的是误差,那么一旦我们找到函数值最小的位置,就等于找到了接近正确的分布。

如何去找这个位置,如果我们的函数是一个开口向上的二次函数,导数就是我们最好的向导,导数为0的位置是二次函数的最低点。

无论从哪里开始,只要不断向导数绝对值更低的方向调整,就能找到损失函数的最低点。

请添加图片描述

真实的损失函数更像崎岖不平的山区,找到最低点没那么容易,这时我们就需要梯度(Gradient),虽然它也不知道最低点在哪,但可以像导数一样为我们指出向下的方向,顺着它的指引,我们总会来到山下。

请添加图片描述

至于梯度下降,就是沿着梯度所指出的方向,一步一步向下走,去寻找损失函数最小值的过程,然后我们就找到了接近正确的模型。

http://www.lryc.cn/news/137470.html

相关文章:

  • 开黑啦kook 机器人开发 PHP swoole Liunx 服务器(宝塔)
  • Vue 中hash 模式与 history 模式的区别
  • Dockerfile推送私有仓库的两个案例
  • 【指标】指标公式大全,款款经典(建议珍藏)!-神奇指标网
  • 面试题目收集
  • 创建R包-2.1:在RStudio中使用Rcpp制作R-Package(更新于2023.8.23)
  • chatGPT如何解释泽众PerformanceRunner性能测试工具?
  • LA@向量组线性相关性
  • [k8s] 基于ubuntu22部署k8s1.28记录
  • React 事件代理 和原生事件绑定混用:你的选择会导致什么问题?
  • 使用阿里云国外和国内云服务器有什么注意事项?
  • 【计算机网络】【常考问题总结】
  • 前端基础(props emit slot 父子组件间通信)
  • 即时通讯:短轮询、长轮询、SSE 和 WebSocket 间的区别
  • 高忆管理:药店零售概念回落,开开实业走低,此前7日大涨超80%
  • Go1.19 排序算法设计实践 经典排序算法对比
  • 3:Ubuntu上配置QT交叉编译环境并编译QT程序到Jetson Orin Nano(ARM)
  • CentOS下MySQL的彻底卸载的几种方法
  • Spring 的异常处理机制
  • java八股文面试[JVM]——JVM参数
  • 面试热题(复原ip地址)
  • 【JavaSE】Java方法的使用
  • Node.js 安装和配置(完整详细版)
  • 剪枝基础与实战(4):稀疏训练及剪枝效果展示
  • CentOS 7.6使用yum安装stress,源码安装stree-ng 0.15.06,源码安装sysstat 12.7.2
  • POI groupRow 折叠分组,折叠部分不显示问题
  • 一、数据库基础
  • Harmony OS教程学习笔记
  • 605. 种花问题
  • Elasticsearch 常见的简单查询