当前位置: 首页 > news >正文

【深度学习基础7】预训练、激活函数、权重初始化、块归一化

一、Unsupervised Pre-training

得益于 Hinton and Salakhutdinov 在 2006 年的开创性工作— 无监督预训(unsupervised pre-training);在《Reducing the dimensionality of data with neural networks.》这篇论文中,他们在 RBMs 中引入无监督预训练,下面我们将在Autoencoders中讲解这一方法(建议了解Restricted 玻尔兹曼机):
在这里插入图片描述
经过这一步后,第一层的权重被训练,使得 h1 捕获输入 x 的重要信息。然后,将第一层的权重固定,在第二层上重复这一过程。经过这一步后,第二层的权重被训练,使得 h2 捕获 h1 的重要信息,继续这一过程,直到最后一个隐含层。【最后一个隐含层是输出层的前一层

预训练结束后,使用训练出的权重来初始化隐含层的权重。所得到的网络能够学习到输入数据类别独立的特征表示 (class independent 因为没有使用到数据的标签 y)。 预训练结束后,再在网络上增加输出层,使用特定的目标(或损失函数)来训练整个网络。整个过程可以理解为:先使用无监督的预训练(无监督的目标)来初始化网络权重,再使用特定有监督的目标来 fine tune 整个网络。

二、激活函数

详见:

http://www.lryc.cn/news/290.html

相关文章:

  • MetaMQ
  • 热门盘点 | 10款评分最高的项目管理工具
  • 若依框架---分页功能
  • CHAPTER 3 Jenkins SVN GItlab
  • 为什么Redis集群的最大槽数是16384个?
  • 餐饮企业数据可视化大屏(智慧餐饮)
  • Kafka安装及zookeeper is not a recognized option问题解决
  • leetcode刷题 | 关于二叉树的题型总结1
  • webpack新手入门
  • Redis中有常见数据类型
  • 【知识梳理】Go语言核心编程
  • Java中动态调用setter以及getter
  • 基于 NeRF 的 App 上架苹果商店!照片转 3D 只需一部手机,网友们玩疯了
  • C++类与对象(中)
  • 计算机软件技术基础复习
  • python爬虫--beautifulsoup模块简介
  • Swfit Copy On Write 原理解析
  • 【面试题】经典面试题:让 a == 1 a == 2 a == 3 成立?
  • 我是歌手-C语言
  • Acwing---112.雷达设备
  • SSJ-21A AC220V静态【时间继电器】
  • m序列发生器——Verilog设计
  • Mysql—触发器
  • DVWA靶场通关和源码分析
  • RocketMQ5.0.0消息存储<二>_消息存储流程
  • 【单片机方案】蓝牙体温计方案介绍
  • React 的受控组件和非受控组件有什么不同
  • 【逐步剖C】-第六章-结构体初阶
  • Java 并发在项目中的使用场景
  • 15.面向对象程序设计