当前位置: 首页 > news >正文

12 权重衰退

过拟合的应对方法——weight_decay

权重衰退是最广泛使用的正则化方法之一。

模型容量受参数个数和参数范围影响,通过L2正则项限制w的取值范围,权重w每次更新乘以小于1的数,w的数值范围不会太大,从而降低模型复杂度,减轻过拟合风险。

两种方法:

一、使用正则项权重超参数lambd

lambd为0,w的L2范式很大,无作用。lambd趋近无穷大,w的L2范式很少,参数w趋近于0。通过增加lambd,w的取值减小,让模型不那么复杂。

# 定义l2范式惩罚
def l2_penalty(w):return torch.sum(w.pow(2)) / 2# 超参数lambd加入损失函数
l = loss(net(X), y) + lambd * l2_penalty(w)

二、在优化器中设置weight_decay参数。常用框架都包含该参数,在更新梯度前对w进行衰减。

总结:调大lambd,w减少,减轻过拟合

当lambd很大,欠拟合

问题:

1.为什么模型参数范围大模型复杂度高?

如下图需要模拟红色的点。如果我们让模型参数取很大的数值,可以用很复杂的模型来拟合红色的点,如果是二次或者三次函数,权重取的很大或者很小,可以造成一个非常不平滑的曲线。如果对模型取值限定在一个范围,不让学习复杂的模型,就会选择比较平滑的模型,例图中绿色的曲线。

2.实际中权重参数一般多少?

常用值:1的-3次方=0.001,1的-4次方=0.0001

http://www.lryc.cn/news/149892.html

相关文章:

  • 简化测试流程,提供卓越服务:TestComplete+Salesforce满足不断发展的企业的需求
  • kafka 命令脚本说明以及在java中使用
  • Qt应用开发(基础篇)——文件选择对话框 QFileDialog
  • 图像OCR转文字,验证码识别技术太疯狂-UI软件自动化
  • Docker:自定义镜像
  • 【Nginx22】Nginx学习:FastCGI模块(四)错误处理及其它
  • 轮毂电机单位换算-米每秒/转每分
  • 博流RISC-V芯片BL616开发环境搭建
  • Weblogic漏洞(三)之 Weblogic 弱口令、任意文件读取漏洞
  • 15 mysql tiny/meidum/long blob/text 的数据存储
  • 【方案】基于视频与AI智能分析技术的城市轨道交通视频监控建设方案
  • mysql8 修改数据存储位置
  • Qt QSlider样式
  • Redis五大数据类型
  • chatGPT训练过程
  • 原神角色数据分析项目说明文档
  • 【Qt】QML-04:自定义变量(属性)property
  • 基于Cadence Allegro无盘设计操作流程
  • 微信小程序 - 2023年最新版手机号快捷登录详细教程
  • Spring_Bean的自动装配
  • 使用boost::geometry::union_ 合并边界(内、外)- 方案一
  • 面向高速公路车辆切入场景的自动驾驶测试用例生成方法
  • Java:SpringBoot整合SSE(Server-Sent Events)实现后端主动向前端推送数据
  • cmd命令行设置 windows 设置环境变量
  • 基于负载均衡的在线OJ实战项目
  • Opencv手工选择图片区域去水印
  • 《向量数据库》——向量数据库跟大模型是什么关系呢?
  • 通过这 5 项 ChatGPT 创新增强您的见解
  • W5500-EVB-PICO主动PING主机IP检测连通性(十)
  • 解释基本的3D理论