当前位置: 首页 > news >正文

什么是BERT?工程快速入门


基本介绍

全称是Bidirectional Encoder Representations from Transformers。BERT翻译成中文通常被称为“双向编码器表征法”或简单地称为“双向变换器模型

Bidirectional:是双向神经网络,这个在学习 RNN 时候我们就了解到如何使用双向 RNN 让每一个词视野更加广阔,不但可以看到其前面词还能看到其后面的词。

Encoder:说明 BERT 是编码器。

Representations:BERT 是完成词的表征的任务的模型,之前我们已经学过了了 word2vec。

Transformer:其实 BERT 就是 transform 解码器部分,表示 BERT 结构没有采用 LSTM 这样。 RNN 结构,而是采用了 Transformer 这样结构来实现双向循环神经网,Transformer 对象 LSTM 的优势是并行计算
 

在自然语言处理领域,BERT以其出色的性能和广泛的应用而著称,为多种语言理解任务提供了强大的预训练模型基础

1)预训练阶段:BERT通过预训练任务来学习语言的深层表示。这些任务通常包括“遮蔽语言模型”(Masked Language Model,MLM)(类似于完形填空)和“下一句预测”(Next Sentence Prediction,NSP)。在MLM任务中,模型被训练来预测输入句子中被遮蔽的词;而在NSP任务中,模型需要判断两个句子是否是连续的文本序列。

2)微调阶段:预训练完成后,BERT模型可以通过添加任务特定的输出层来进行微调,以适应不同的NLP任务,如情感分析、问答、命名实体识别等。微调过程利用了预训练阶段学到的语言表征,使得模型能够快速适应新的任务并取得优异的性能。

3)模型结构BERT模型是由多层的Transformer编码器堆叠而成,每一层都包含自注意力机制(Self-Attention)和前馈神经网络。这种深层结构使得BERT能够捕捉从浅层语法特征到深层语义特征的不同级别的语言信息。

4)性能表现:BERT在多个NLP任务上取得了当时的最先进结果,显著推动了自然语言处理技术的发展。它的成功也催生了许多后续的研究工作,包括对BERT结构的改进以及在不同语言和领域中的应用。


预训练:预训练是一种迁移学习的概念。所谓预训练模型,举个例子,假设我们有大量的维基百科数据,那么我们可以用这部分巨大的数据来训练一个泛化能力很强的模型(一个知识渊博的人,见多识广),当我们需要在特定场景使用时,例如做医学命名实体识别,那么,只需要简单的修改一些输出层,再用我们自己的数据进行一个增量训练,对权重进行一个轻微的调整即可(增加行业知识后,这个知识渊博的人就是行业专家)。预训练语言模型有很多,典型的如ELMO、GPT、BERT等
 

相关资料



BERT详解:概念、原理与应用-CSDN博客

http://www.lryc.cn/news/427460.html

相关文章:

  • SQL - 事务
  • 系统, 安装完以后只能进ubuntu
  • 闲鱼功能全解析:闲置物品快速变现
  • 牛客网SQL进阶129 :月均完成试卷数不小于3的用户
  • Astro + Cloudflare Pages 快速搭建个人博客
  • Vue中<style scoped>与<style module>的深入解析与应用
  • Qt系列之数据库(二)代码篇
  • @RequstParam@PathVariable@RequestBody的区别
  • Maven继承和聚合特性
  • python opencv实时视频输入
  • 为什么头文件不能写using namespace
  • 使用 preloadRouteComponents 提升 Nuxt 应用的性能
  • mybatisPlus的@TableLogic逻辑删除注解导致联合索引失效的坑
  • C# 隐式转换和显式转换
  • 入门网络安全工程师要学习哪些内容
  • 深入理解 Go 并发原语
  • 计算机毕业设计选题推荐-springboot 基于springboot的宠物健康顾问系统
  • 数据结构—— 初识二叉树
  • 2024.08.09校招 实习 内推 面经
  • IDEA中设置类和方法的注释
  • Adobe Premiere Pro 2023-23.6.7.1 解锁版下载与安装教程 (一款专业的视频编辑软件)
  • openGauss 6.0安装过程解除对root用户依赖之gs_preinstall
  • IOS 10 统一颜色管理和适配深色模式
  • Linux目录结构及基础查看命令和命令模式
  • UDP和TCP协议段格式分析
  • Go语言基础--条件判断(if语句)
  • 白骑士的C#教学实战项目篇 4.2 图形用户界面(GUI)应用
  • 【Java学习】反射和枚举详解
  • leetcode-461. 汉明距离
  • rpmbuild 将二进制文件 strip,文件 md5 发生改变