当前位置: 首页 > article >正文

深度学习与神经网络 前馈神经网络

1.神经网络特征

无需人去告知神经网络具体的特征是什么,神经网络可以自主学习

2.激活函数性质

(1)连续并可导(允许少数点不可导)的非线性函数

(2)单调递增

(3)函数本身及其导函数要尽可能的简单

(4)导函数的值域要在合适的范围内

3.常用激活函数

(1)sigma函数

(2)tanh函数

sigma和tanh均为饱和函数,且sigma函数存在特征变量之间只能向同一方向迭代(非负)导致迭代速度慢,且二者均可能由于层数过多在反向传播时出现梯度消失的现象(导函数的取值在0-1之间)

(3)ReLU函数

ReLU变体

(4)LeakyRuLU函数

(5)PReLU函数

ReLU及其变体激活函数也被称为斜坡函数,可以有效避免梯度消失问题和迭代次数过多问题,最激活函数最常用的就是ReLU函数

4.前馈神经网络结构

输入层----隐藏层----输出层

各神经元分别属于不同的层,层内无连接;相邻两层之间的神经元全部两两相连(单向);整个网络中无反馈,信号从输入层向输出层单向传播,可用一个有向无环图表示

5.前向传播

从输入层向输出层信息传播的算法

6.反向传播

从输出层向输入层信息传播的算法

7.梯度消失&梯度爆炸

均发生在反向传播算法当中,链式法则存在连乘效应,如果梯度处于0-1或大于1时,当层数足够大时,容易出现0和无穷的现象导致梯度消失和爆炸

解决思路:

http://www.lryc.cn/news/2396719.html

相关文章:

  • NLP学习路线图(十四):词袋模型(Bag of Words)
  • Oracle数据库事务学习
  • MySQL 全量 增量备份与恢复
  • 【仿生机器人系统设计】涉及到的伦理与安全问题
  • NodeJS全栈WEB3面试题——P5全栈集成与 DApp 构建
  • 鸿蒙进阶——Mindspore Lite AI框架源码解读之模型加载详解(一)
  • 【数据结构】图论核心算法解析:深度优先搜索(DFS)的纵深遍历与生成树实战指南​
  • Mysql数据库 索引,事务
  • RESTful APInahamcon Fuzzies-write-up
  • 安装DockerDocker-Compose
  • 2025年机械化设计制造与计算机工程国际会议(MDMCE 2025)
  • Java生态中的NLP框架
  • NVM,Node.Js 管理工具
  • Jmeter逻辑控制器、定时器
  • 每日八股文6.2
  • R3GAN利用配置好的Pytorch训练自己的数据集
  • 吴恩达机器学习笔记(1)—引言
  • 信贷风控规则策略累计增益lift测算
  • 【笔记】Windows 部署 Suna 开源项目完整流程记录
  • 【Elasticsearch】Elasticsearch 核心技术(一):索引
  • AudioTrack的理解
  • HTTP请求与HTTP响应介绍及其字段
  • Fullstack 面试复习笔记:操作系统 / 网络 / HTTP / 设计模式梳理
  • 中科院报道铁电液晶:从实验室突破到多场景应用展望
  • 智慧政务标准规范介绍:构建高效、协同的政务信息体系
  • 6个月Python学习计划 Day 12 - 字符串处理 文件路径操作
  • CSS篇-3
  • Unity使用Lua框架和C#框架开发游戏的区别
  • Go开发简历优化指南
  • 手机照片太多了存哪里?