当前位置: 首页 > news >正文

机器学习 - 线性回归

线性回归模型的定义

线性回归(Linear Regression)的目标旨在找到可以描述目标值(输出变量)与一个或多个特征(输入变量)之间关系的一个线性方程或函数。 线性回归模型的表达式为

                                                      

线性回归模型表达式的“齐次”形式为:

线性回归是通过拟合自变量与因变量之间最佳线性关系,来预测目标变量的方法。

回归过程是给出一个样本集, 用函数拟合这个样本集,使样本集与拟合函数间的误差最小。

线性回归模型的学习准则(策略)

模型的训练即寻找最佳参数向量 ,以使模型能够尽可能好地拟合所有的样本数据

定义代价函数为:

                                       

最小二乘法和正规方程

最小二乘法(Least Square Method,LSM)又称最小平方法,是解决回归拟合问题最常用的一种优化方法。它通过最小化每个观测数据与预测值之间误差的平方和来寻找数据的最佳函数拟合。

正规方程(Normal Equation),它是最小二乘法的矩阵形式。

                                                               

最小二乘估计

                                                           

梯度下降法的基本思想是一直朝着函数梯度向量相反方向不断地迭代更新模型参数,可以使函数值得到最快的下降,从而能够尽可能快速地逼近函数极小值点直至收敛,得到最小化的代价函数和最优的模型参数值。

                                

梯度下降法

批量梯度下降(Batch Gradient Descent,BGD)

在每次迭代更新参数时,都需要用到全部的训练样本数据来计算目标函数的梯度。

随机梯度下降(Stochastic Gradient Descent,SGD)

在每次迭代更新参数时,从训练样本集中随机选取一个训练样本来计算目标函数的梯度。

小批量梯度下降 (Mini-Batch Gradient Descent,MBGD)

在每次迭代更新参数时,选取训练样本集中给定数量(一般取值为 2~100)的训练样本来计算目标函数的梯度。

线性回归(Linear Regression):

利用数理统计中回归分析,确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

回归模型:实值预测        

如:房价预测:

实值预测常用的两种方法:

一元线性回归VS多元线性回归

线性回归: 一元线性回归

目标:找到一条最能拟合数据分布的直线,即模型输出值 y ̂ 与实际值 y 尽可能接近,即偏差尽可能小。

                                 

求解:如何确定a 和b 的值?

                                                 

一元线性回归模型求解:确定b 的值

一元线性回归模型求解:确定 a 的值

一元线性回归模型求解:确定曲线

多元线性回归

实例二:多元线性回归预测电影票房收入

总结

一元线性回归算法实现

from sklearn import datasets
from sklearn.linear_model import LinearRegression
data = datasets.load_boston()   #导入波士顿房价数据
linear_model = LinearRegression()    #构建模型
linear_model.fit(X_train,y_train) #训练模型
lr_y_predict=linear_model(X_test) #模型预测

http://www.lryc.cn/news/513675.html

相关文章:

  • NestJS 性能优化:从应用到部署的最佳实践
  • 本地快速推断的语言模型比较:Apple MLX、Llama.cpp与Hugging Face Candle Rust
  • 您的公司需要小型语言模型
  • 智能工厂的设计软件 应用场景的一个例子:为AI聊天工具添加一个知识系统 之14 方案再探 之5:知识树三类节点对应的三种网络形式及其网络主机
  • JR-RLAA系20路模拟音频多功能编码器
  • LabVIEW冷却风机性能测试系统
  • Python-Pdf转Markdown
  • pyQT + OpenCV相关练习
  • 音视频入门基础:MPEG2-PS专题(3)——MPEG2-PS格式简介
  • 云计算学习架构篇之HTTP协议、Nginx常用模块与Nginx服务实战
  • Zookeeper模式安装Kafka(含常规、容器两种安装方式)
  • 【游戏设计原理】41 - 游戏的核心
  • 机器学习算法基础知识1:决策树
  • [Qt] 信号和槽(1) | 本质 | 使用 | 自定义
  • 33. 简易内存池
  • win32汇编环境,对话框程序模版,含文本框与菜单简单功能
  • 人工智能与传统编程的主要区别是什么?
  • 实战交易策略 篇十一:一揽子交易策略
  • doris 2.1 -Data Manipulation-Transaction
  • 多模态融合:阿尔茨海默病检测
  • Ceph 手动部署(CentOS9)
  • 家政预约小程序05活动管理
  • 解决安装pynini和WeTextProcessing报错问题
  • 【PCIe 总线及设备入门学习专栏 4.1 -- PCI 总线的地址空间分配】
  • 华为配置 之 RIP
  • 探寻AI Agent:开启知识图谱自动生成新篇章(17/30)
  • 卸载wps后word图标没有变成白纸恢复
  • LeetCode 热题 100_二叉树的直径(40_543_简单_C++)(二叉树;递归)
  • 【数据结构】线性数据结构——链表
  • 开源存储详解-分布式存储与ceph