当前位置: 首页 > news >正文

了解神经网络中的激活函数

一、激活函数的特征

  1. 非线性,激活函数必须是非线性函数。
  2. 可微性,训练网络模型时,基于梯度的模型最优化方法要求激活函数必须是可导的。
  3. 单调性,单调递增或单调递减,单调函数保证模型的简单。
  4. 隐藏层一般需要使用激活函数已引入非线性,输入层不需要。输出层如果是回归问题也是不需要的,如果是多分类问题,使用softmax函数将输出转化为概率分布,如果是二分类问题,可以使用sigmoid函数。

二、常见的激活函数

  1. sigmoid函数

    sigmoid激活函数: f ( x ) = 1 1 + e − x f(x)=\frac{1}{1+e^{-x}} f(x)=1+ex1,其导数为: f ′ ( x ) = f ( x ) ( 1 − f ( x ) ) f'(x)=f(x)(1-f(x)) f(x)=f(x)(1f(x)),导数的取值范围[0, 1/4],sigmoid在使用反向传播来训练神经网络时,会产生梯度消失的问题,另外sigmoid处理后的输出数据是一个非负值,在反向传播过程中会增加梯度的不稳定性。

  2. tanh函数

    tanh激活函数: f ( x ) = e x − e − x e x + e − x f(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}} f(x)=ex+exexex,其导数为: f ′ ( x ) = 1 − f ( x ) 2 f'(x)=1-f(x)^2 f(x)=1f(x)2,导数的取值范围为[0, 1],反向传播过程中衰减速度比sigmoid要慢,经过tanh激活函数处理后的输出均值约为0(这相当于做了归一化),所以tanh比sigmoid具有更稳定的梯度,但是依然无法避免梯度消失的问题。

  3. 近似生物神经元的激活函数

    如ReLU,softplus等,还有Leaky ReLU,ELU,Softmax等。

三、常见的神经网络模型

神经网络类型主要特点典型应用场景
前馈神经网络信息单向流动,无反馈循环;层级结构清晰;常用于分类和回归问题图像分类、文本分类、回归预测
反馈神经网络(RNN)信息可以在网络中循环传播,具有记忆能力;适用于序列数据自然语言处理(机器翻译、情感分析)、语音识别、时间序列预测
卷积神经网络(CNN)利用卷积核提取局部特征,适用于图像、视频等数据图像分类、目标检测、图像分割
循环神经网络变种(LSTM、GRU)改进RNN,解决了长期依赖问题,更好地处理长序列数据自然语言处理、语音识别
生成对抗网络(GAN)由生成器和判别器组成,通过对抗学习生成新的数据图像生成、数据增强
图神经网络(GNN)处理图结构数据,适用于社交网络、分子结构等社交网络分析、药物发现
http://www.lryc.cn/news/474463.html

相关文章:

  • 配置BGP与IGP交互和路由自动聚合示例
  • 代码随想录算法训练营第三十三天 | 62.不同路径 63.不同路径
  • 使用Flask构建RESTful API
  • 基于springboot的Java学习论坛平台
  • Python离线环境搭建
  • windows下kafka使用出现的问题
  • ctfshow文件包含web78~81
  • 鸿蒙生态认识
  • Hadoop-004-Big Data Tools插件的使用
  • linux8在线扩容/home目录
  • 【C/C++】模拟实现strcpy
  • 网络编程番外——IO多路复用的应用说明
  • 【Java爬虫的淘宝寻宝记】—— 淘宝商品类目的“藏宝图”
  • 探索Python文档自动化的奥秘:揭开docxtpl库的神秘面纱
  • RabbitMQ的解耦、异步、削峰是什么?
  • 4:arm汇编语言4:bits/byte的介绍(ASCII码)与二进制补位
  • C++实现仿安卓线程Handler、Message、Looper的功能
  • 构建安全的用户登录API:从请求验证到JWT令牌生成
  • 状态模式:封装对象状态并改变行为的设计模式
  • 备战“双11”丨AI+物流:你的快递会有什么变化?
  • 理解为什么要有C++设计模式
  • 模式匹配类型
  • 每天10个vue面试题(七)
  • 如何在Linux系统中使用Apache HTTP Server
  • C++基于opencv的视频质量检测--画面冻结检测
  • Day22 opencv图像预处理
  • QT中的定时器与计时器
  • 国内AI大模型学习平台
  • 曹操出行借助 ApsaraMQ for Kafka Serverless 提升效率,成本节省超 20%
  • 深入理解数据库的三范式