当前位置: 首页 > news >正文

机器学习—为什么我们需要激活函数

如果我们使用神经网络中每个神经元的线性激活函数,回想一下这个需求预测示例,如果对所有节点使用线性激活函数,在这个神经网络中,事实证明,这个大神经网络将变得与线性回归没有什么不同,所以这将挫败使用神经网络的全部目的,只是无法拟合比线性回归模型更复杂的东西。

用一个更简单的例子来说明这一点,看一个神经网络的例子,其中输入x只是一个数字,有一个隐藏单位,参数w和b,输出一个,这里只是一个数字a[1],然后第二层是输出层,它也只有一个输出单元,参数为w2 b2,输出一个a2,也就是一个数字,只是一个标量,它是神经网络f(x)的输出,如果用线性激活函数,g(z)=z,将x=a1计算,神经网络将使用a1=g(w)*x+b1,具体替换如下图所示,所以w只是一个线性函数而不是使用一个隐藏层和一个输出层的神经网络,还不如用线性回归模型,如果熟悉线性代数,线性函数的线性函数本身就是线性函数,这就是为什么在神经网络中有多层,不会让神经网络计算更复杂的特征或者学习比线性函数更复杂的东西。

所以在一般情况下,如果你有一个像这样的多层神经网络,假设你对所有隐藏层使用线性激活函数,并对输出层使用线性激活函数,这个模型将计算出完全等价于线性回归的输出,输出a4可以表示为输入特征的线性函数,如果仍然对所有隐藏层使用线性激活函数,这里的这三个隐藏层,但我们要对输出层使用逻辑激活函数,然后证明这个模型等价于Logistic回归,所以这个大神经网络什么也不做,不能用逻辑回归,这就是为什么一个常见的经验法则是不要在神经网络的隐藏层中使用线性激活函数,事实上,使用relu激活函数应该很好。

http://www.lryc.cn/news/480315.html

相关文章:

  • 软考系统架构设计师论文:论软件的可靠性评价
  • C++:线程(thread)的创建、调用及销毁
  • 关于随身wifi,看了再决定要不要买!2024年最受欢迎的随身wifi品牌推荐!
  • SpringMVC总结 我的学习笔记
  • DevCheck Pro手机硬件检测工具v5.33
  • 数据分析ReAct工作流
  • Rust-AOP编程实战
  • Flutter鸿蒙next 中的 Expanded 和 Flexible 使用技巧详解
  • 【微信小游戏学习心得】
  • Python | Leetcode Python题解之第539题最小时间差
  • Zookeeper运维秘籍:四字命令基础、详解及业务应用全解析
  • Error: `slot-scope` are deprecated报错解决
  • Excel(图例)中使用上标下标
  • 熔断和降级
  • 【学习笔记】Linux系统基础知识 6 —— su命令详解
  • docker-compose命令介绍
  • Spring学习笔记_29——@Transactional
  • github使用基础
  • Flink-Kafka-Connector
  • 远程终端vim里使用系统剪切板
  • 底层视角看C语言
  • 【点云学习笔记】——分割任务学习
  • Qt——窗口
  • InfluxDB性能优化指南
  • 负载均衡式在线oj项目开发文档2(个人项目)
  • ssm081高校实验室管理系统的设计与实现+vue(论文+源码)_kaic
  • GitLab基于Drone搭建持续集成(CI/CD)
  • 用GPB外链打造长期稳定的SEO优势!
  • 第11章 内连接与外连接
  • C++ 游戏开发:打造高效、性能优越的游戏世界