当前位置：首页 > news >正文

梯度下降的基本原理

news 2025/8/2 7:29:51

序言：最近再整理之前的一些笔记，感觉梯度下降之前整理的很详细也很杂乱，删了也不是，留着看着也烦，就发到这里来当个备用吧。

随机梯度下降(SGD)

求极小值：①有条件的极小值(有条件的用拉格朗日)，②无条件的极小值(无条件的用梯度下降)。

梯度是什么：

梯度有什么用：

怎么走:

梯度下降的迭代举例：

关键算法：

Momentum算法

NAG算法

Adagrad算法

RMSprop算法

解决了Adagrad算法中学习率衰减过快的问题。

改进点：1.时间窗口机制

2.均值代替平方和

3.历史梯度均值和当前梯度加权平均

AdaDelta算法

Adam算法

Adam吸收了Adagrad（自适应学习率的梯度下降算法）和动量梯度下降算法的优点既能适应稀疏梯度（即自然语言和计算机视觉问题），又能缓解梯度震荡的问题.

查看全文

http://www.lryc.cn/news/606953.html

Oracle EBS ERP开发 — 抛出异常EXCEPTION书写规范

Vue3 setup、ref和reactive函数

ReAct模式深度解析：构建具备推理能力的AI智能体架构

【Linux】System V - 责任链模式与消息队列

机密计算与AI融合：安全与智能的共生架构

动态爱心树

Linux(CentOS 7.9) 卸载、安装MySql 5.7详细步骤教程，包括密码设置、字符集设置等

VS Code中配置使用slint（Rust）的一个小例子

Java学习第九十六部分——Eureka

基于CNN卷积神经网络图像识别28个识别合集-视频介绍下自取

k8s之DevicePlugin

运维端口管理闭环：从暴露面测绘到自动化封禁！

自动驾驶的未来：多模态传感器钻机

【通用视觉框架】基于OpenCvSharp+WPF+YOLO开发的仿VisionMaster的通用视觉框架软件，全套源码，开箱即用

CTF实战：用Sqlmap破解表单输入型SQL注入题（输入账号密码/usernamepassword）

音频获取长度

armbian 启用nginx并设置访问密码

gpu instancer crowd 插件大规模渲染

《操作系统真象还原》第五章保护模式进阶

深度SEO优化的方式有哪些，从技术层面来说

WaitForSingleObject 函数参数影响及信号处理分析

第15讲——微分方程

Shader开发（六）什么是着色器

遥控器信号捕获

软件反调试（7）- 基于NtSetInformationThread设置线程信息

邮件系统哪个好？3种类型邮件系统详细对比