当前位置: 首页 > news >正文

【python】keras包:深度学习( RNN循环神经网络 Recurrent Neural Networks)

RNN循环神经网络

应用:

物体移动位置预测、股价预测、序列文本生成、语言翻译、从语句中自动识别人名、
问题总结 这类问题,都需要通过历史数据,对未来数据进行预判

序列模型

两大特点

  1. 输入(输出)元素具有顺序关系,有前后关系
  2. 输入输出不定长。如:文章生成、聊天机器人

简单理解

在这里插入图片描述
以人名识别为例
在这里插入图片描述

常见结构

多输入单输出结构

eg. 自然语言文字的情感识别
输入:语句(文字为多个输入信息)
输出:情感判断(是积极的还是消极的)

单输入多输出结构

eg. (序列数据生成器)根据关键词生成文章、音乐等
输入:关键词(单维信息)
输出:文章(多元信息)

多输入多输出结构

eg. 语言翻译
输入:中文(n维数据)
输出:英文(m维数据)

普通RNN模型

越新的信息对结果的影响占比越大,越旧的信息对结果的影响占比越小
缺陷 : 可能导致重要的旧信息丢失(图中蓝色在y中的占比即表示旧信息在结果中的影响占比)
在这里插入图片描述

长短期记忆网络(LSTM)

算法逻辑:增加记忆细胞 C[i],以记忆重要信息
在这里插入图片描述

双向循环神经网络(BRNN)

简单理解 : 普通循环神经网络,只根据上文推测下文;双向循环神经网络,则是根据上文和下文来推测当前片段。

深层循环神经网络(DRNN)

简单理解 单层RNN+MLP,实现更好的拟合效果

实战一:RNN实现股价预测

算法效果

给定(数据-时间轴)数据集,
设定Input_shape = (samples, time_steps, features) ,
sample表示样本数量(默认为:根据输入数据自动计算)
time_steps表示每次用前time_steps个数据预测下一个数据
features 表示样本的特征维数
生成预测曲线

算法流程:

Step 1. 数据载入 与 预处理
序列切断:按time_steps的长度,对被预测数据进行切断

# 数据切断函数
import numpy as np
def extract_data(data,time_step):x=[] #前time_step个时间点的数据y=[] #当前被预测时间点的数据for i in range(len(data)-time_step):x.append( [a for a in data[i:i+time_step] ] )y.append( data[i+time_step] )x = np.array(x)x = x.reshape(x.shape[0],x.shape[1],1)y = np.array(y)return x,y
time_step = int(input("输入参考时间区间的长度:"))
x,y = extract_data(price_norm,time_step)
#print(x.shape)

Step 2. 建立RNN模型

from keras.models import Sequential
from keras.layers import Dense,SimpleRNN
#顺序模型
model = Sequential()
#RNN层
model.add( SimpleRNN(units=5, #神经元个数input_shape = (time_step,1),# 输入格式:以前time_step为根据,预测当前位置# 数据维数为 1activation = 'relu',#  激活函数用relu)
)
#输出层
model.add(Dense(units=1,activation='linear'))
#参数设置
model.compile(optimizer='adam', loss='mean_squared_error', #平方差metrics=['accuracy'] #这个模型看accuracy没有意义
)
model.summary()

Step 3. 预测

pred_y_train = model.predict(x) * max(price) #逆归一化
y_train = y*max(price)
#训练数据-预测训练数据预览
from matplotlib import pyplot as plt
fig1 = plt.figure(figsize=(8,5))
truth, = plt.plot(y_train)
pred, = plt.plot(pred_y_train)
plt.title('close price')
plt.xlabel('date')
plt.ylabel('price')
plt.legend( (pred,truth), ('pred_line','true_line'))
plt.show()

实战二:LSTM自动生成文本

算法效果

给定(文本)数据集,
构建 (文本-编码)字典
输入 编码后的文本数据
生成预测文本的编码
编码转文本

算法流程

Step 1. 数据载入 与 预处理
Step 2. 建立RNN模型
Step 3. 预测

http://www.lryc.cn/news/65200.html

相关文章:

  • vue框架快速入门
  • Java连接顺丰开放平台
  • 前端三剑客 - HTML
  • 【计算机视觉 | 自然语言处理】BLIP:统一视觉—语言理解和生成任务(论文讲解)
  • c++基础-运算符
  • 美术馆c++
  • 浅谈MySQL索引以及执行计划
  • 在c++项目中使用rapidjson(有具体的步骤,十分详细) windows10系统
  • 编译方式汇总:Makefile\configure\autogen.sh\configure.ac、Makefile.am文件
  • explicit关键字
  • [优雅的面试] 你了解python的对象吗
  • 【hello Linux】线程概念
  • JavaWeb07(MVC应用01[家居商城]连接数据库)
  • 如何使用电商API接口API接口如何应用
  • 【移动端网页布局】流式布局案例 ⑥ ( 多排按钮导航栏 | 设置浮动及宽度 | 设置图片样式 | 设置文本 )
  • 1. 先从云计算讲起
  • ZooKeeper安装与配置集群
  • 浅谈Mysql的RR和RC隔离级别的主要区别
  • Build生成器模式
  • C++程序设计——常见C++11新特性
  • Rust main 函数返回值类型不能是 String
  • 视频里的音乐怎么转换成mp3格式?
  • CSS3 grid网格布局
  • SPSS如何进行均值比较和T检验之案例实训?
  • Packet Tracer - 配置交换机端口安全
  • 一图看懂 aiohttp 模块:基于 asyncio 的异步HTTP网络库, 资料整理+笔记(大全)
  • Linux + 香橙派 + V4L2 + http 实现远程监控摄像头在网页端显示
  • 《编码——隐匿在计算机软硬件背后的语言》精炼——第15-16章(十六进制,RAM)
  • leetcode.1376 通知所有员工所需的时间 - bfs/dfs + 树
  • AtCoder Beginner Contest 300——A-G题讲解