当前位置: 首页 > news >正文

sklearn线性回归--岭回归

sklearn线性回归--岭回归

岭回归也是一种用于回归的线性模型,因此它的预测公式与普通最小二乘法相同。但在岭回归中,对系数(w)的选择不仅要在训练数据上得到好的预测结果,而且还要拟合附加约束,使系数尽量小。换句话说,w的所有元素都应接近于0。直观上来看,这意味着每个特征对输出的影响应尽可能小(即斜率很小),同时仍给出很好地预测结果。这种约束就是正则化。正则化是指对模型做显示约束,以避免过拟合。岭回归用到的这种被称为L2正则化。下面来看一下岭回归对波士顿房价数据集的效果如何(该数据集的介绍见链接: link):

在这里插入图片描述
由上图可以看出,Ridge模型在训练集上的分数要低于LinearRegression,但在测试集上的分数更高。线性回归对数据存在过拟合。Ridge是一种约束更强的模型,所以更不容易过拟合。复杂度更小的模型意味着在训练集上的性能更差,但泛化性能更好。由于我们只对泛化性能感兴趣,所以应该选择Ridge而不是LinearRegression模型。
Ridge模型在模型的简单性(系数都接近于0)与训练集性能之间做出权衡。简单性和训练集性能二者对于模型的重要程度可以由用户通过设置alpha参数来指定。在前面的例子中,我们用的是默认参数alpha=1.0。但没有理由认为这会给出最佳权衡。alpha的最佳设定值取决于用到的具体数据集。增大alpha会使得系数更加趋向于0,从而降低训练集性能,但可能会提高泛化性能。例如:
在这里插入图片描述
减小alpha可以让系数受到的限制更小。对于非常小的alpha值(比如0.1),系数几乎没有受到限制,我们得到一个与LinearRegression类似的模型。

http://www.lryc.cn/news/356300.html

相关文章:

  • 三十一、openlayers官网示例Draw Features解析——在地图上自定义绘制点、线、多边形、圆形并获取图形数据
  • 医疗科技:UWB模块为智能医疗设备带来的变革
  • Java面试题大全(从基础到框架,中间件,持续更新~~~)
  • 零知识证明在隐私保护和身份验证中的应用
  • 15.微信小程序之async-validator 基本使用
  • 元宇宙vr科普馆场景制作引领行业潮流
  • kotlin基础之高阶函数
  • 【Python音视频技术】用moviepy实现图文成片功能
  • 【Linux】权限的理解之权限掩码(umask)
  • UVa1466/LA4849 String Phone
  • 使用Word表格数据快速创建图表
  • JAVA面试题大全(十三)
  • 搜维尔科技:第九届元宇宙数字人设计大赛入围作品名单
  • SMB工具横向移动
  • cesuim
  • 2023、2024国赛web复现wp
  • day34 贪心算法 455.分发饼干 376. 摆动序列
  • 养老院管理系统基于springboot的养老院管理系统java项目
  • 跳台阶扩展问题
  • 超清高帧,成像升级 | SWIR短波红外相机500万像素992芯片
  • 攻击渗透思考题
  • Flutter 中的 Opacity 小部件:全面指南
  • 【介绍下如何在SQL中添加数据】
  • 【Linux学习】深入了解Linux中进程状态及其转换
  • 【Python设计模式11】建造者模式
  • coredump文件生成配置
  • jmeter线程组(下篇)
  • Stable Diffusion【写实模型】:逼真,逼真,超级逼真的国产超写实摄影大模型万享XL
  • Android 13 配置默认DN
  • 系统开发与运行知识