当前位置: 首页 > news >正文

[论文笔记]MacBERT

引言

今天带来MacBERT的阅读笔记。论文题目是 重新审视中文自然语言处理的预训练模型。

本篇主要是探讨中文预训练语言模型在非英文语言中的有效性,然后提出了一种简单而有效的模型,称为MacBERT,它在多个方面改进了RoBERTa,特别是采用纠错型掩码语言模型(MLM as correction,Mac)的掩码策略。

通过实验表明MacBERT在很多NLP任务中能取得SOTA结果。

总体介绍

BERT已经变成NLP领域的新的基础组件。从BERT开始,人们在优化预训练语言模型方面取得了巨大而迅速的进展。比如ERINE1、XLNet2、RoBERTa3、SpanBERT4、ALBERT5、ELECTRA6等。

然而相比我们过去训练词嵌入或其他传统的神经网络,训练基于Transformer的模型没那么容易。比如,训练一个BERT-large,它有330M参数包含24层Transformer,训练起来非常昂贵。虽然很多预训练语言模的变种被提

http://www.lryc.cn/news/179430.html

相关文章:

  • AI发展目前最大挑战是什么?
  • 自然语言处理NLP:LTP、SnowNLP、HanLP 常用NLP工具和库对比
  • 百度交易中台之内容分润结算系统架构浅析
  • 【索引】常见的索引、B+树结构、什么时候需要使用索引、优化索引方法、索引主要的数据结构、聚簇索引、二级索引、创建合适的索引等重点知识汇总
  • Egg 封装接口返回信息
  • Android AMS——创建APP进程(五)
  • 凉鞋的 Unity 笔记 102. 场景层次 与 GameObject 的增删改查
  • 信息安全:网络安全审计技术原理与应用.
  • 嵌入式Linux应用开发-第十三章APP怎么读取按键值
  • Web 中间件怎么玩?
  • HMTL知识点系列(4)
  • CFS内网穿透靶场实战
  • 【RabbitMQ实战】07 3分钟部署一个RabbitMQ集群
  • PS 切片工具 选择切片 切片存储
  • Git版本控制系统
  • Element UI搭建首页导航和左侧菜单以及Mock.js和(组件通信)总线的运用
  • What is an HTTP Flood DDoS attack?
  • 第 114 场 LeetCode 双周赛题解
  • [Java框架] Java常用爬虫框架推荐
  • Kafka:安装与简单使用
  • 029-从零搭建微服务-消息队列(一)
  • Python2020年06月Python二级 -- 编程题解析
  • 差分放大器的精髓:放大差模信号 抑制共模信号
  • 蓝桥等考Python组别九级006
  • 初级篇—第五章子查询
  • 【AntDesign】封装全局异常处理-全局拦截器
  • Visual Studio 代码显示空格等空白符
  • 紫光同创FPGA图像视频采集系统,基于OV7725实现,提供工程源码和技术支持
  • 京东大型API网关实践之路
  • 图像处理: 马赛克艺术