当前位置: 首页 > news >正文

单变量回归问题

单变量回归问题

对于某房价问题,x为房屋大小,h即为预估房价,模型公式为:
hθ(x)=θ0+θ1xh_{\theta}(x)=\theta_{0}+\theta_{1}x hθ(x)=θ0+θ1x
要利用训练集拟合该公式(主要是计算θ0、θ1\theta_{0}、\theta_{1}θ0θ1),需要代价函数(计算当前模型和测试集数据的误差),
J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(\theta_{0},\theta_{1})=\frac{1}{2m}\sum_{i=1}^{m}{(h_{\theta}(x^{(i)})-y^{(i)})^2} J(θ0,θ1)=2m1i=1m(hθ(x(i))y(i))2
当代价函数得到最小值时,此时拟合的公式最好。一般利用梯度下降法来得到代价函数的局部(全局)最优解。批量梯度下降的公式为
θj:=θj−α∂∂θjJ(θ0,θ1)(forj=0andj=1)\theta_{j}:=\theta_{j}-\alpha\frac{\partial }{\partial \theta_{j}}J(\theta_{0},\theta_{1}) (for \quad j=0\quad and \quad j=1) θj:=θjαθjJ(θ0,θ1)(forj=0andj=1)

∂∂θjJ(θ0,θ1)=∂∂θj(12m∑i=1m(hθ(x(i))−y(i))2)\frac{\partial }{\partial \theta_{j}}J(\theta_{0},\theta_{1})=\frac{\partial }{\partial \theta_{j}}(\frac{1}{2m}\sum_{i=1}^{m}{(h_{\theta}(x^{(i)})-y^{(i)})^2}) θjJ(θ0,θ1)=θj(2m1i=1m(hθ(x(i))y(i))2)

j=0时,∂∂θ0J(θ0,θ1)=1m∑i=1m(hθ(x(i))−y(i))j=0时,\frac{\partial }{\partial \theta_{0}}J(\theta_{0},\theta_{1})=\frac{1}{m}\sum_{i=1}^{m}{(h_{\theta}(x^{(i)})-y^{(i)})} j=0时,θ0J(θ0,θ1)=m1i=1m(hθ(x(i))y(i))

j=1时,∂∂θ1J(θ0,θ1)=1m∑i=1m(hθ(x(i))−y(i))⋅x(i)j=1时,\frac{\partial }{\partial \theta_{1}}J(\theta_{0},\theta_{1})=\frac{1}{m}\sum_{i=1}^{m}{(h_{\theta}(x^{(i)})-y^{(i)})\cdot x^{(i)}} j=1时,θ1J(θ0,θ1)=m1i=1m(hθ(x(i))y(i))x(i)

α\alphaα为学习率,决定沿着代价函数下降程度最大的方向向下的步子有多大,在批量梯度下降中,我们每一次都同时让所有的参数减去学习速率乘以代价函数的导数。

如果α\alphaα太小了,即我的学习速率太小,需要很多步才能到达最低点,可能会很慢;
如果α\alphaα太大,那么梯度下降法可能会越过最低点,甚至可能无法收敛。

在梯度下降法中,当我们接近局部最低点时,梯度下降法会自动采取更小的幅度,这是因为当我们接近局部最低点时,很显然在局部最低时导数等于零,所以当我们接近局部最低时,导数值会自动变得越来越小,所以梯度下降将自动采取较小的幅度,这就是梯度下降的做法。所以实际上没有必要再另外减小α\alphaα

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qARHfSRE-1677383475783)(C:\Users\20491\AppData\Roaming\Typora\typora-user-images\image-20230222172604462.png)]

http://www.lryc.cn/news/21287.html

相关文章:

  • ubuntu/linux系统知识(36)linux网卡命名规则
  • java的一些冷知识
  • java代理模式
  • JUC包:CountDownLatch源码+实例讲解
  • Log4j2基本使用
  • A2L在CAN FD总线的使用
  • Android JetPack之启动优化StartUp初始化组件的详解和使用
  • [11]云计算|简答题|案例分析|云交付|云部署|负载均衡器|时间戳
  • C++11/C++14:lambda表达式
  • 算法课堂-分治算法
  • 操作系统权限提升(十六)之绕过UAC提权-CVE-2019-1388 UAC提权
  • 实例9:四足机器人运动学正解平面RR单腿可视化
  • 堆的基本存储
  • 如何获取物体立体信息通过一个相机
  • 【数据挖掘实战】——中医证型的关联规则挖掘(Apriori算法)
  • 一些硬件学习的注意事项与快捷方法
  • 【Tomcat】Tomcat安装及环境配置
  • 负载均衡:LVS 笔记(二)
  • SEO优化:干货技巧分享,包新站1-15天100%收录首页
  • JavaWeb测试题
  • Java EE|TCP/IP协议栈之数据链路层协议详解
  • Lighthouse组合Puppeteer检测页面
  • 【C++】仿函数、lambda表达式、包装器
  • 二叉树(二)
  • 爬虫知识简介
  • 2023年全国最新会计专业技术资格精选真题及答案6
  • 同时学习C++语言和C#语言好吗?
  • Android8,source与lunch流程解析
  • 大数据NiFi(二十):实时同步MySQL数据到Hive
  • mac 如何设置 oh my zsh 终端terminal 和添加主题powerlevel10k