当前位置: 首页 > news >正文

【NLP11-迁移学习】

1、了解迁移学习中的有关概念
1.1、预训练模型(pretrained model)

一般情况下预训练模型都是大型模型,具备复杂的网络结构,众多的参数量,以及在足够大的数据集下进行训练而产生的模型。在NLP领域,预训练模型往往是语言模型,因为语言模型的训练是无监督的,可以获得大规模语料,同时语言模型又是许多典型的NLP任务的基础,如机器翻译、文本生成、阅读理解等。常见的预训练模型有BERT,GPT,roBERTa,transformer-XL等。

1.2、微调(Fine-tuning)

根据给定的预训练模型,改变它的部分参数或者为其新增部分输出结构后,通过在小部分数据集上训练,来使整个模型更好的适用特定任务

1.3、微调脚本(Fine-tuning script)

实现微调过程的代码文件。这些脚本文件中,应包括对预训练模型的调用,对微调参数的选定以及对微调结构的更改等。同时,因为微调是一个训练过程,她同样需要一些超参数的设定,以及损失函数和优化器的选取等,因此微调脚本往往也包含了整个迁移学习的过程。

1.4、关于微调脚本的说明

一般情况下,微调脚本应该由不同的任务类型开发者自己编写,但是由于目前研究NLP任务类型(分类、提取、生成)以及对应的微调输出结构都是有限的,有些微调方式已经在很多数据集上被验证有效的,因此微调脚本也可以使用已经完成的规范脚本

2、两种迁移方式

直接使用预训练模型,进行相同任务的处理,不需要调整参数或模型结构,这些模型开箱即用。但是这种情况一般只适用于普适任务。如fasttest工具包预训练的词向量模型。另外,很多预训练模型开发者为了达到开箱即用的效果,将模型结构分各个部分保存为不同的预训练模型,提供对应的加载方法来完成特定目标。

更加主流的迁移学习方式是发挥预训练模型特征抽象的能力,然后再通过微调的方式,通过训练更新小部分参数以此来适应不同的任务。这种迁移方式需要提供小部分的标注数据来进行监督学习。

说明:

直接使用预训练模型的方式,已经在fasttext的词向量迁移中学习。

3、NLP中标准数据集

NLP中GLUE标准数据集合的介绍

GLUE是由纽约大学,华盛顿大学,google联合推出,涵盖不同NLP任务类型,截至至2020年1月,其中包含11个子任务数据集,成为衡量NLP研究发展的衡量标准。

GLUE数据集包含以下数据集

  • CoLA 数据集
  • SST-2 数据集
  • MRPC 数据集
  • STS-B 数据集
  • QQP 数据集
  • MNLI 数据集
  • SNLI 数据集
  • QNLI 数据集
  • RTE 数据集
  • WNLI 数据集
  • diagnostics数据集(官方未完善)

下载数据集

http://www.lryc.cn/news/320851.html

相关文章:

  • Android11 FallbackHome启动和关闭流程分析
  • elasticsearch-java api 8 升级
  • HCIA_IP路由基础问题?
  • (黑马出品_高级篇_01)SpringCloud+RabbitMQ+Docker+Redis+搜索+分布式
  • 高架学习笔记之信息系统分类概览
  • 2023新版mapinfo美化电子地图 新版2013Arcgis shp电子地图 下载
  • BUUCTF-Ezsql1
  • LiveGBS流媒体平台GB/T28181功能-大屏播放上大屏支持轮巡播放分屏轮巡值守播放监控视频轮播大屏轮询播放轮播
  • npm和pnpm安装、更换镜像源
  • springcloud 复习day1~[自动装配]
  • 模块化开发在不同编程语言中的实现方式有何异同?并以LabVIEW为例进行说明
  • 外贸网站文章批量生成器
  • maven一点通
  • 超越标签的探索:K-means与DBSCAN在数据分析中的新视角
  • linux板子vscode gdb 远程调试
  • nginx代理服务器配置
  • 基于Matlab的视频人面检测识别,Matalb实现
  • VSCode创建用户代码片段-案例demo
  • 河南大学-数字图像处理-图像变换
  • 华为OD七日集训第3期 - 按算法分类,由易到难,循序渐进,玩转OD
  • Android中的进程间通讯
  • day03vue学习
  • 32. 最长有效括号
  • 如何在 docker 容器内部运行 docker命令
  • Poly Kernel Inception Network在遥感检测中的应用
  • tiktok 与 赵长鹏 遭遇了什么
  • Lua中文语言编程源码-第七节,更改lstrlib.c 标准字符串操作与模式匹配库函数, 使Lua加载中文库关键词(标准字符串操作与模式匹配库相关)
  • EtherCAT开源主站 IGH 介绍及主站伺服控制过程
  • 自然语言:python实现自然语言处理中计算文件中的英语字母的熵
  • 分类预测 | Matlab实现BiTCN双向时间卷积神经网络数据分类预测/故障识别