当前位置: 首页 > news >正文

神经网络中的激活函数举例,它们各自的特点,以及哪个激活函数效果更好,为什么

  • sigmoid: \(\sigma(x)=1/(1+e^{-x})\);
    • 优:将数值压缩到 0 1,导数为 \(\sigma(x)(1-\sigma(x))\) 好算。
    • 劣:输出均值非0(0.5),梯度消失(Gradient vanishing)每次传过来的梯度都会乘上小于1的值,靠近输出的层 参数更新幅度大,而靠近输入的层 参数更新幅度小。
  • ReLU: max(0, x) REctified Linear Unit
    • 优:不饱和(梯度不会过小),计算量小
    • 劣:输出均值非0,Dead ReLU:某层输入< 0,相应的输出值为0,那么此时该层就会"死亡",参数不会更新,而且不可逆转,神经元永远失效。
    • Leaky ReLU: >0, 1 | <0, 0.1。解决 Dead ReLU。
  • Tanh:
    • 优:输出均值为0,原点附近与 y = x 函数相近;
    • 劣:梯度消失(Gradient vanishing,但比 sigmoid 好),计算量大。
http://www.lryc.cn/news/401874.html

相关文章:

  • 【树莓派3B+】控制引脚输出高低电平
  • 【Redis7】高阶篇
  • 在学习使用LabVIEW的过程中,需要注意哪些问题?
  • 网络编程-TCP/IP
  • php在服务器上部署可视化运维工具详细列表
  • Linux中的文件夹作用
  • 【C++】C++中的assign函数详解
  • Hadoop3:MR程序的数据倾斜问题处理
  • Mojo 编程语言简介
  • 【有效验证】解决SQLyog连接MYSQL的错误 1251 - Client does not support
  • Keka for Mac v1.4.3 中文下载 解压/压缩工具
  • springboot3.2 RedisCacheManager配置
  • IP地址与MAC地址区别
  • Linux chmod 命令简介
  • 【LeetCode】删除排序链表中的重复元素 II
  • Pandas使用 `iloc` 和 `loc` 常见用法汇总
  • 【linux服务器】大语言模型实战教程:LLMS大模型快速部署到个人服务器
  • Windows 32 汇编笔记(二):使用 MASM
  • 手机和电脑通过TCP传输(一)
  • Sentinel规则持久化Push模式两种实现方式
  • Spring Boot 中使用 Resilience4j 实现弹性微服务的简单了解
  • Hadoop3:MR程序压测实验
  • 初学者如何通过建立个人博客盈利
  • 构建稳健性:如何在Gradle中配置构建失败时的行为
  • 大语言模型-基础及拓展应用
  • STM32使用Wifi连接阿里云
  • 2024.7.16日 最新版 docker cuda container tookit下载!
  • 打印室预约小程序的设计
  • Android音视频—OpenGL 与OpenGL ES简述,渲染视频到界面基本流程
  • Vscode中Github copilot插件无法使用(出现感叹号)解决方案