当前位置: 首页 > news >正文

2022最新版-李宏毅机器学习深度学习课程-P26RNN-2

 一、RNN网络结构

与时间有关的反向传播(每次不同) 

损失函数

实验其实不容易跑,因为他的损失函数曲线幅度很大

画出来差不多是这个样子。突然一下升高是因为从右到左碰到陡峭的地方梯度一下变大了,所以弹回去了。

原作者在训练时加上了小技巧——clipping:设置一个峰值,若超过则等于该峰值。

梯度大的原因:

  • 当W>1时,微小的变化会引起很大的变化;
  • 当w<1时,较大的变化带来的变化也很小。

RNN一些有用的变形

LSTM以及简化为双门的GRU

Clockwise RNN && SCRN

多对一

多长对多短

这里是最后删去重复的字符

改加上null符号后,可以实现一些叠词

CTC方法

多对多(无限制)

加上一个断的符号,可以及时终止

可以用在机器学习上

语法分析

自动编码器

可以提高传输效率和节约成本

http://www.lryc.cn/news/199509.html

相关文章:

  • docker 配置mongoDB
  • 基于PHP的宠物爱好者交流平台管理系统设计与实现(源码+lw+部署文档+讲解等)
  • 盘点数据采集中14种常见的反爬策略
  • 直播预告:防御升级-SMC2精准对抗账号劫持和漏洞威胁
  • 班主任好物 班级查询系统来啦
  • 【性能测试】使用JMeter对code论坛进行压力测试
  • Windows 事件日志监控
  • pytorch里常用操作(持续更新)
  • 地铁大数据客流分析系统 设计与实现 计算机竞赛
  • 00后都到适婚年龄啦!90后的还在低调什么?
  • reactnative使用七牛云上传图片
  • 在JavaScript中,如何创建一个数组或对象?
  • 001.第一个C语言项目
  • luffy项目后端轮播图接口
  • 如何通过Photoshop将视频转换成GIF图片
  • 书单|1024程序员狂欢节充能书单!
  • GRS认证与TC交易证明的区别
  • 高精度时间测量(TDC)电路MS1022
  • js关键字
  • 《算法通关村第二关——指定区间反转问题解析》
  • 掌控安全Update.jsp SQL注入
  • C#将图片转换为ICON格式(程序运行图标)
  • ELK架构Logstash的相关插件:grok、multiline、mutate、date的详细介绍
  • linux 防火墙介绍以及iptables的使用
  • 原码、反码、补码在汇编中的应用
  • 【红日靶场】vulnstack5-完整渗透过程
  • 嵌入式平台的电源总结
  • @Binds methods must be abstract 报错指南
  • 自定义反序列化类将LocalDate时间格式转为 LocalDateTime
  • MySQL JSON_TABLE() 函数