当前位置: 首页 > news >正文

昇思11天

基于 MindSpore 实现 BERT 对话情绪识别

BERT模型概述

BERT(Bidirectional Encoder Representations from Transformers)是由Google于2018年开发并发布的一种新型语言模型。BERT在许多自然语言处理(NLP)任务中发挥着重要作用,例如问答、命名实体识别、自然语言推理和文本分类。BERT基于Transformer中的Encoder,并采用了双向的结构,因此掌握Transformer的Encoder结构是理解BERT的基础。

BERT模型的主要创新点

BERT模型的主要创新点在于其预训练方法,即使用了**Masked Language Model(MLM)Next Sentence Prediction(NSP)**两种方法来分别捕捉词语和句子级别的表征(representation)。

Masked Language Model(MLM)

在MLM训练中,随机将语料库中15%的单词进行Mask操作。具体操作如下:

  • 80%的单词直接用[Mask]替换。
  • 10%的单词替换成其他随机的单词。
  • 10%的单词保持不变。

通过这种方式,模型需要预测被Mask的词,从而捕捉到单词级别的语义信息。

Next Sentence Prediction(NSP)

NSP的目的是让模型理解两个句子之间的联系。训练的输入是句子A和B,B有一半的几率是A的下一句。通过预测B是否为A的下一句,模型能够学习到句子级别的语义关系。

BERT的预训练和Fine-tuning

BERT预训练之后,会保存其Embedding table和12层Transformer权重(BERT-BASE)或24层Transformer权重(BERT-LARGE)。预训练好的BERT模型可以用于下游任务的Fine-tuning,如文本分类、相似度判断和阅读理解等。

对话情绪识别(EmoTect)

对话情绪识别(Emotion Detection,简称EmoTect),旨在识别智能对话场景中的用户情绪。针对用户文本,自动判断其情绪类别并给出相应的置信度。情绪类型一般分为积极、消极和中性。对话情绪识别适用于聊天、客服等多个场景,帮助企业更好地把握对话质量、改善用户交互体验,分析客服服务质量并降低人工质检成本。
步骤:通过 BertForSequenceClassification 构建用于情感分类的 BERT 模型,加载预训练权重,设置情感三分类的超参数自动构建模型。后面对模型采用自动混合精度操作,提高训练的速度,然后实例化优化器,紧接着实例化评价指标,设置模型训练的权重保存策略,最后就是构建训练器,模型开始训练。
有构建好的,直接调用:
from mindnlp.transformers import BertForSequenceClassification, BertModel

在这里插入图片描述

http://www.lryc.cn/news/393543.html

相关文章:

  • AI绘画Stable Diffusion【图生图教程】:图片高清修复的三种方案详解,你一定能用上!(附资料)
  • 适用于Mac和Windows的最佳iPhone恢复软件
  • 64.ThreadLocal造成的内存泄漏
  • 深入刨析Redis存储技术设计艺术(二)
  • python读取写入txt文本文件
  • 日期选取限制日期范围antdesign vue
  • 【大模型】衡量巨兽:解读评估LLM性能的关键技术指标
  • 《优化接口设计的思路》系列:第2篇—小程序性能优化
  • prototype 和 __proto__的区别
  • 网络中未授权访问漏洞(Rsync,PhpInfo)
  • DataWhaleAI分子预测夏令营 学习笔记
  • lnmp php7 安装ssh2扩展
  • 数据库概念题总结
  • 提升用户体验之requestAnimationFrame实现前端动画
  • Mysql慢日志、慢SQL
  • 卫星网络——Walker星座简单介绍
  • C++ Lambda表达式第一篇, 闭合(Closuretype)
  • 移动校园(3):处理全校课程数据excel文档,实现空闲教室查询与课程表查询
  • 【MySQL】1.初识MySQL
  • 查看电脑显卡(NVIDIA)应该匹配什么版本的CUDA Toolkit
  • 优化:遍历List循环查找数据库导致接口过慢问题
  • NoSQL 之 Redis 配置与常用命令
  • 用SpringBoot打造坚固防线:轻松实现XSS攻击防御
  • 2024机器人科研/研发领域最新研究方向岗位职责与要求
  • 笔记:Newtonsoft.Json 序列化接口集合
  • 【Unity设计模式】✨使用 MVC 和 MVP 编程模式
  • CDH安装和配置流程
  • SpringMVC:SpringMVC执行流程
  • 如何在前端网页实现live2d的动态效果
  • 昇思25天学习打卡营第15天|linchenfengxue