当前位置: 首页 > news >正文

机器学习(11):岭回归Ridge

岭回归是失损函数通过添加所有权重的平方和的乘积(L2)来惩罚模型的复杂度。

均方差除以2是因为方便求导,w_j指所有的权重系数, λ指惩罚型系数,又叫正则项力度

特点:

  • 岭回归不会将权重压缩到零,这意味着所有特征都会保留在模型中,但它们的权重会被缩小。

  • 适用于特征间存在多重共线性的情况。

  • 岭回归产生的模型通常更为平滑,因为它对所有特征都有影响。

    from sklearn.linear_model import Ridge
    from sklearn.model_selection import train_test_split
    from sklearn.datasets import fetch_california_housing
    from sklearn.preprocessing import StandardScaler
    from sklearn.metrics import mean_squared_errorx,y = fetch_california_housing(return_X_y=True,data_home = "./src")x_train,x_test,y_train,y_test = train_test_split(x,y,test_size = 0.2,random_state = 42)
    scaler = StandardScaler()
    x_train = scaler.fit_transform(x_train)
    x_train = scaler.fit_transform(x_train)model = Ridge(alpha = 1,max_iter = 100,fit_intercept=True)#调节这里的alpha可以改变w
    model.fit(x_train,y_train)y_hat = model.predict(x_test)
    print("loss:",mean_squared_error(y_test,y_hat))
    print("w:",model.coef_)
    print("b:",model.intercept_)

    具有L2正则化的线性回归-岭回归。
    sklearn.linear_model.Ridge()
    1 参数:
    (1)alpha, default=1.0,正则项力度
    (2)fit_intercept, 是否计算偏置, default=True
    (3)solver, {‘auto’, ‘svd’, ‘cholesky’, ‘lsqr’, ‘sparse_cg’, ‘sag’, ‘saga’, ‘lbfgs’}, default=’auto’
    当值为auto,并且数据量、特征都比较大时,内部会随机梯度下降法。
    (4)normalize:,default=True, 数据进行标准化,如果特征工程中已经做过标准化,这里就该设置为False
    (5)max_iterint, default=None,梯度解算器的最大迭代次数,默认为15000

    2 属性
    coef_ 回归后的权重系数
    intercept_ 偏置


    说明:SGDRegressor也可以做岭回归的事情,比如SGDRegressor(penalty='l2',loss="squared_loss"),但是其中梯度下降法有些不同。所以推荐使用Ridge实现岭回归

http://www.lryc.cn/news/610285.html

相关文章:

  • 服务器的Mysql 集群技术
  • 经典设计模式
  • YOLO11涨点优化:原创自研DSAM注意力!基于BiLevelRoutingAttention的颠覆性升级
  • 06 基于sklearn的机械学习-欠拟合、过拟合、正则化、逻辑回归
  • Ethereum: 深度解析Web3世界的合规之门, ERC-1400证券型代币标准
  • ISCC认证:可持续生产的新标杆。ISCC如何更快认证
  • 线程互斥锁:守护临界区的关键
  • 服务器数据安全:利用阿里云OSS/腾讯云COS实现网站数据自动备份
  • 2.5 DICOM 传输语法(Transfer Syntaxes)
  • 【Canvas与文字】生存与生活
  • 文件与目录操作命令
  • SRIO入门之官方例程仿真验证
  • History 模式 vs Hash 模式:Vue Router 技术决策因素详解
  • 数据结构——并查集及C++实现
  • 0.08B参数以小博大:用小模型生成媲美GPT-4o的古典诗词
  • 土壤温度传感器CG-03在实际应用中的价值体现
  • 刷题记录0804
  • AI小说创作工具体验:本地部署助力文学创作,Ollama+AIStarter一键搞定
  • 数据驱动建模——数据孪生继续
  • docker-compose一键部署Springboot+Vue前后端分离项目
  • 《Leetcode》-面试题-hot100-子串
  • 【Java 基础】transient 有什么作用?
  • 强反光场景误报率↓82%!陌讯多模态融合算法在贵重物品识别的技术突破​
  • 机器学习——决策树(DecisionTree)+ 过采样 + 交叉验证 案例:电信客户流失数据
  • FLutter 如何在跨平台下实现国际化多语言开发
  • Easysearch 集成阿里云与 Ollama Embedding API,构建端到端的语义搜索系统
  • python与C++
  • 【测试】⾃动化测试概念篇
  • (八)嵌入式系统
  • (三)软件架构设计