当前位置: 首页 > news >正文

7 线性回归及Python实现

1 统计指标

  • 随机变量XXX的理论平均值称为期望: μ=E(X)\mu = E(X)μ=E(X)
  • 但现实中通常不知道μ\muμ, 因此使用已知样本来获取均值
    X‾=1n∑i=1nXi.\overline{X} = \frac{1}{n} \sum_{i = 1}^n X_i. X=n1i=1nXi.
  • 方差variance定义为:
    σ2=E(∣X−μ∣2).\sigma^2 = E(|X - \mu|^2). σ2=E(Xμ2).
  • 用已知样本的数据来代替:
    S2=Var(X)=1n∑i=1n(Xi−μ)2.S^2 = Var(X) = \frac{1}{n} \sum_{i = 1}^n (X_i - \mu)^2. S2=Var(X)=n1i=1n(Xiμ)2.
  • 由于μ\muμ未知, 使用贝塞尔校正:
    S2=Var(X)=1n−1∑i=1n(Xi−X‾)2.S^2 = Var(X) = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_i - \overline{X})^2. S2=Var(X)=n11i=1n(XiX)2.
  • 原因: 在已知数据上, 使用X‾\overline{X}X获得的结果一般更小:
    ∑i=1n−1(Xi−X‾)2≤∑i=1n−1(Xi−μ)2.\sum_{i = 1}^{n - 1} (X_i - \overline{X})^2 \leq \sum_{i = 1}^{n - 1} (X_i - \mu)^2. i=1n1(XiX)2i=1n1(Xiμ)2.
  • 更多解释: https://www.zhihu.com/question/20099757
  • 标准差:
    σX=S=Var(X).\sigma_X = S = \sqrt{Var(X)}. σX=S=Var(X).

偏差与方差:
在这里插入图片描述

  • 方差(again)
    Var(X)=σX2=1n−1∑i=1n(Xi−X‾)(Xi−X‾).Var(X) = \sigma_X^2 = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_i - \overline{X})(X_i - \overline{X}). Var(X)=σX2=n11i=1n(XiX)(XiX).
  • 协方差
    Cov(X,Y)=1n−1∑i=1n(Xi−X‾)(Yi−Y‾).Cov(X, Y) = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_i - \overline{X})(Y_i - \overline{Y}). Cov(X,Y)=n11i=1n(XiX)(YiY).
  • Pearson相关系数
    Corr(X,Y)=ρX,Y=Cov(X,Y)σXσY.Corr(X, Y) = \rho_{X, Y} = \frac{Cov(X, Y)}{\sigma_X \sigma_Y}. Corr(X,Y)=ρX,Y=σXσYCov(X,Y).

2 线性回归

2.1 回归任务

分类与回归

  • 分类任务预测类别,即是/否等离散值:如是否生病;
  • 回归任务预测实型值:如气温

拟合空间中的点 (注意数据点没有类别标记, 输出也占一维):

  • 一个条件属性:直线;
  • 两个条件属性:平面;
  • 更多条件属性:超平面.

拟合线:
在这里插入图片描述

3 局部线性回归

4 岭回归

5 Lasso回归

6 小结

http://www.lryc.cn/news/26766.html

相关文章:

  • 适合小团队协作、任务管理、计划和进度跟踪的项目任务管理工具有哪些?
  • 从100%进口到自主可控,从600块降到10块,中科院攻克重要芯片
  • 关于git的一些基本点总结
  • PyTorch保姆级安装教程
  • MySQL 上亿大表如何优化?
  • Git(狂神课堂笔记)
  • 「2」指针进阶,最详细指针和数组难题解题思路
  • 云服务器是做什么的?云服务器典型的应用场景介绍
  • 【论文随笔】Transfer of temporal logic formulas in reinforcement learning
  • 蓝桥杯-货物摆放
  • 10 种顶流聚类算法 Python 实现(附完整代码)
  • 微信小程序第一节 —— 自定义顶部、底部导航栏以及获取胶囊体位置信息。
  • 快速吃透π型滤波电路-LC-RC滤波器
  • 聊聊混沌工程
  • 做为骨干网络的分类模型的预训代码安装配置简单记录
  • 网络协议(九):应用层(域名、DNS、DHCP)
  • 有趣的小知识(三)提升网站速度的秘诀:掌握缓存基础,让你的网站秒开
  • SpringCloud之服务拆分和实现远程调用案例
  • mybatis: Invalid bound statement (not found): com.atguigu.dao.UserDao.save
  • JavaScript 代码规范
  • 6综合项目 旅游网 【6.我的收藏和收藏排行榜】
  • openpnp - error - 微调mark点坐标后,更新板子其他原件其他坐标报错的变通方法
  • 借助ChatGPT爆火,股价暴涨又暴跌后,C3.ai仍面临巨大风险
  • 蓝桥杯-数位排序
  • 【ES实战】ES 插件包离线安装(本地文件)
  • Spring的核心基础——IOC与DI
  • C++正则表达式基础
  • 如何在网络安全中使用人工智能并避免受困于此
  • 生态 | 人大金仓与超聚变的多个产品完成兼容认证
  • 4自由度串联机械臂按颜色分拣物品功能的实现