当前位置: 首页 > news >正文

激活函数对比

激活函数

        sigmoid / tanh / relu / leaky relu / elu / gelu / swish

1、sigmoid  

优缺点

        1) 均值!=0,导致f=wx+b求导时,方向要么全正要么全负

                可以通过batch批量训练来缓解

        2) 输入值大于一定范围梯度就会消失

        3) 运算复杂

2、tanh

优缺点

1) 均值=0

2) 计算复杂

3) 梯度消失

3、Relu (0,x)

优点

        1) 没有梯度消失问题

        2) 计算速度快

        3) 收敛速度比sigmoid/tanh快很多

缺点

        1) 也非0均值

        2) dead unit,权重初始化不好,导致多数样本在某个单元上<0,则永远失效

4、ELU

优缺点

1)均值接近0,最小值-1

2)没有dead unit

3)计算量变大

4)实验效果比relu稍好

5、swish

优缺点

        1)导数平滑,没有不可导点

        2)导数总是有值,没有dead unit

6、gelu

Φ(x)=高斯分布的累积分布与sigmoid图形近似

gelu(x)≈x∗σ(1.7x)

优缺点与swish类似

http://www.lryc.cn/news/365590.html

相关文章:

  • pycharm 上一次编辑位置不见了
  • FFmpeg播放器的相关概念【1】
  • =与==的优先级
  • 在Linux上的Java项目导出PDF乱码问题
  • java:使用shardingSphere访问mysql的分库分表数据
  • 红酒:如何选择适合的红酒储存容器
  • 【C++】 使用CRT 库检测内存泄漏
  • python手动搭建transformer,并实现自回归推理
  • AI数据分析:用deepseek进行贡献度分析(帕累托法则)
  • 生成式人工智能的风险与治理——以ChatGPT为例
  • 十足正式在山东开疆拓土!首批店7月初开业,地区便利店现全新面貌!
  • Unity2D游戏开发-玩家控制
  • 如何在 Windows 11 上免费恢复永久删除的文件
  • Spring boot 集成mybatis-plus
  • 数据仓库之缓慢变化维
  • 跑mask2former(自用)
  • Linux日志服务rsyslog深度解析(上)
  • python的df.describe()函数
  • Feign的介绍与说明
  • 【Linux】用户和组的管理、综合实训
  • B=2W,奈奎斯特极限定理详解
  • 【Pytorch 】Dataset 和Dataloader制作数据集
  • [Algorithm][动态规划][两个数组的DP][正则表达式匹配][交错字符串][两个字符串的最小ASCII删除和][最长重复子数组]详细讲解
  • Ffmpeg安装和简单使用
  • 29、matlab算数运算汇总2:加、减、乘、除、幂、四舍五入
  • <Rust><iced>基于rust使用iced库构建GUI实例:动态改变主题色
  • k8s——安全机制
  • Linux驱动应用编程(三)UART串口
  • 【设计模式深度剖析】【4】【行为型】【策略模式】
  • opencv dnn模块 示例(26) 目标检测 object_detection 之 yolov10