当前位置: 首页 > news >正文

卷积神经网络训练情感分析

文章目录

  • 1 CNN在自然语言的典型应用
  • 2 代码解释
  • 3 建议

1 CNN在自然语言的典型应用

  • 卷积的作用在于利用文字的局部特征,一个词的前后几个词必然和这个词本身相关,这组成该词所代表的词群
  • 词群进而会对段落文字的意思进行影响,决定这个段落到底是正向,还是负向
  • 深度学习中的卷积让神经网络去构造特征
  • 下面介绍用Keras搭建卷积神经网络来处理情感分析的分类问题

2 代码解释

  • Sequential(): 这个语句初始化了一个空的顺序模型。顺序模型是线性的,意味着你可以逐层添加,每一层都按顺序连接到前一层。
    通常情况下,你会在这一行之后添加额外的代码行,以向模型中添加层。
  • Embedding: 这是 Keras 中的一个嵌入层。嵌入层通常用于将整数序列(例如文本中的单词索引)映射为密集向量的序列。在自然语言处理中,这常用于将单词嵌入到连续向量空间中。
  • vocab_size: 这是词汇表的大小,表示模型能够处理的不同单词的数量。
  • 64: 这是嵌入向量的维度,即每个单词将被嵌入到一个64维的向量空间中。
  • input_length: 这是输入序列的长度,指定了输入数据的每个样本有多少个时间步(时间步是序列中的单个元素)。在自然语言处理中,它通常对应于文本序列的最大长度。
  • 全部代码
from keras.datasets import imdb
from keras.layers import Dense,Dropout,Activation,Flatten
from keras.layers import Conv1D,MaxPooling1D
from keras.layers import Embedding
from keras.models import Sequential
from keras.preprocessing import sequence
import numpy as npmaxword = 400
(x_train,y_train),(x_test,y_test) = imdb.load_data()
x_train = sequence.pad_sequences(x_train,maxlen=maxword)
x_test = sequence.pad_sequences(x_test,maxlen=maxword)
vocab_size = np.max([np.max(x_train[i]) for i in range(x_train.shape[0])])+1
model = Sequential()
model.add(Embedding(vocab_size,64,input_length = maxword))model.add(Conv1D(filters=64,kernel_size=3,padding='same',activation='relu'))model.add(MaxPooling1D(pool_size=2))
model.add(Dropout(0.25))model.add(Conv1D(filters=128,kernel_size=3,padding='same',activation='relu'))
model.add(MaxPooling1D(pool_size=2))
model.add(Dropout(0.25))
model.add(Flatten)
model.add(Dense(64,activation='relu'))
model.add(Dense(32,activation='relu'))
model.add(Dense(1,activation='sigmoid'))
model.compile(loss='binary_crossentropy',optimizer='rmsprop',epochs = 20,batch_size = 100)
scores = model.evaluate(x_test,y_test,verbose=1)
print(scores)

3 建议

  • 可以试着调整模型的参数,增加训练次数等,或者使用其他的优化方法
  • 代码里面用了一个Dropout的技巧,大致意思是在每个批量训练过程中,对每个节点,不论是在输入层,还是隐藏层,都有独立的概率让节点变成0
  • 这样的好处是,每次批量训练相当于在不同的小神经网络中进行计算,当训练数据大的时候,每个节点的权重都会被调整多次
  • 在每次训练的时候,系统会努力在有限的节点和小神经网络中找到最佳的权重,这样可以最大化的找到重要特征,避免过度拟合,这就是为什么Dropout会得到广泛的应用
http://www.lryc.cn/news/253440.html

相关文章:

  • github新建项目
  • CRC(循环冗余校验)直接计算和查表法
  • 【算法思考记录】力扣2952. 需要添加的硬币的最小数量【C++,思路挖掘,贪心与证明】
  • 用友NC JiuQiClientReqDispatch反序列化RCE漏洞复现
  • Linux:docker镜像的创建(5)
  • 数据结构与算法-D2D3线性表之顺序表
  • 01_W5500简介
  • 异常 Exception 练习题 (未完成)
  • Linux系统编程:并发与信号总结
  • Jmeter 接口-加密信息发送(一百九十九)
  • 微信小程序nodejs+vue+uniapp视力保养眼镜店连锁预约系统
  • 掌握Vue侦听器(watch)的应用
  • SAP-PP:PP顾问管理系统的相关建议
  • Unity资源路径与读取
  • “大+小模型”赋能油气行业高质量发展
  • 【win32_004】字符串处理函数
  • 如果不小心修改了按钮的名字并且忘记了原名字
  • opencv阈值处理
  • html之JS
  • SQL Server的安装和首个库的创建
  • STM32下载程序的五种方法
  • 基于springboot + vue大学生竞赛管理系统
  • 【详解】Spark数据倾斜问题由基础到深入详解-完美理解-费元星
  • xss漏洞后端进行html消毒
  • [论文精读]利用大语言模型对扩散模型进行自我修正
  • CTF特训日记day(4-6)
  • 【深度学习笔记】09 权重衰减
  • 三大兼容 | 人大金仓兼容+优化MySQL用户变量特性
  • Git介绍与安装使用
  • 理解DuLinkList L中的“”引用符号