当前位置: 首页 > news >正文

【nlp】4.3 nlp中常用的预训练模型(BERT及其变体)

nlp中常用的预训练模型

  • 1 当下NLP中流行的预训练模型¶
    • 1.1 BERT及其变体
    • 1.2 GPT
    • 1.3 GPT-2及其变体
    • 1.4 Transformer-XL
    • 1.5 XLNet及其变体
    • 1.6 XLM
    • 1.7 RoBERTa及其变体
    • 1.8 DistilBERT及其变体
    • 1.9 ALBERT
    • 1.10 T5及其变体
    • 1.11 XLM-RoBERTa及其变体
  • 2 预训练模型说明¶
  • 3 预训练模型的分类

1 当下NLP中流行的预训练模型¶

  • BERT
  • GPT
  • GPT-2
  • Transformer-XL
  • XLNet
  • XLM
  • RoBERTa
  • DistilBERT
  • ALBERT
  • T5
  • XLM-RoBER
http://www.lryc.cn/news/245824.html

相关文章:

  • IDEA中 java: 警告: 源发行版 11 需要目标发行版 11 如何解决
  • APP测试的测试内容有哪些,常见的Bug分类介绍!
  • 【Java程序员面试专栏 专业技能篇】Java SE核心面试指引(三):核心机制策略
  • 网络运维与网络安全 学习笔记2023.11.22
  • Android虚拟化
  • Nginx如何配置负载均衡
  • Python虚拟环境
  • 单片机学习4——中断的概念
  • Go语言网络爬虫工程经验分享:pholcus库演示抓取头条新闻的实例
  • Git安装
  • 以太网通讯协议小结--持续更新中
  • Excel换不了行怎么解决?
  • Flink CDC -Sqlserver to Sqlserver java 模版编写
  • 4.前端--HTML标签-表格列表表单【2023.11.25】
  • MySQL的Redo Log跟Binlog
  • 定制手机套餐---python序列
  • 线性分类器--数据处理
  • 一些可能被忽视的 Vue3 API 附带案例
  • Linux git
  • 136. 只出现一次的数字
  • redis的性能管理及集群架构(主从复制、哨兵模式)
  • 【自然语言处理】正向最大匹配算法(FMM),反向最大匹配算法(BMM)和双向最大匹配算法(BM)原理及实现
  • 数据结构 | 堆排序
  • 编程语言发展史:Go语言的设计和特点
  • FinGPT:金融垂类大模型架构
  • 24. 深度学习进阶 - 矩阵运算的维度和激活函数
  • 杰发科技AC7801——keil工程移植到IAR
  • Word怎么看字数?简单教程分享!
  • 万字解析设计模式之观察者模式、中介者模式、访问者模式
  • 【MySQL | TCP】宝塔面板结合内网穿透实现公网远程访问