当前位置: 首页 > news >正文

端到端模型(end-to-end)与非端到端模型

一、端到端(end to end)

从输入端到输出端会得到一个预测结果,将预测结果和真实结果进行比较得到误差,将误差反向传播到网络的各个层之中,调整网络的权重和参数直到模型收敛或者达到预期的效果为止,中间所有的操作都包含在神经网络内部,不再分成多个模块处理。由原始数据输入,到结果输出,从输入端到输出端,中间的神经网络自成一体(也可以当做黑盒子看待),这就是端到端的模型。

优势
1.只要有足够多的数据,我们不需要知道输入到输出的映射是怎样的,不用引入人类知识,可以充分利用数据本身的信息。

2.所需人工设计的组件更少,能够简化设计工作流程。

二、非端到端(Pipeline)

非端到端是输入->模型A->输出A->模型B->输出B->...->输出。不同于端到端,非端到端可以看作是一个流水线工作,比如在一个典型的NLP问题中,包括分词、词性标注、句法分析、语义分析等多个独立步骤,每个步骤是一个独立的任务,其结果的好坏会影响到下一步骤,从而影响整个训练的结果。

三、序列到序列(seq2seq)

序列到序列是:输入是序列->模型->输出是序列。

序列到序列一种通用的端到端序列学习方法,它基于编码-解码(Encoder - Decoder)的架构。

应用:

示例一: 翻译。如果用英文的序列作为输入,用法语的作为标签,进行训练模型。即可得到一个英语到法语的翻译器。

示例二:文本摘要。如果使用一个新闻文章和对应的摘要数据进行训练。可得到一个文章内容摘要器。

示例三:QA问答机器人。使用问题和答案数据集进行训练,可得到一个问答机器人或聊天机器人。

reference:

https://blog.csdn.net/qq_38410428/article/details/91381151

 

http://www.lryc.cn/news/2064.html

相关文章:

  • uniApp封装一个滑块组件
  • 运动基元(二):贝塞尔曲线
  • Android 11.0 关于Launcher3中调用截图功能总是返回null的解决方案
  • random随机数
  • 【金三银四系列】Spring面试题-上(2023版)
  • linux基本功系列之tar命令实战
  • Prometheus服务发现
  • 【Spring6源码・MVC】请求处理流程源码解析
  • elasticsearch term match 查询
  • canal使用说明:MySQL、Redis实时数据同步
  • 计算机视觉框架OpenMMLab开源学习(三):图像分类实战
  • awk命令
  • LocalDateTime获取时间的年、月、日、时、分、秒、纳秒
  • MoveIT Rviz和Gazebo联合仿真
  • ESP32S2(12K)-DS18B20数码管显示温度
  • linux栈溢出定位
  • CSS基础:选择器和声明样式
  • VS中安装gismo库
  • 元学习方法解决CDFSL以及两篇SOTA论文讲解
  • 大数据之------------数据中台
  • Python 中 字符串是什么?
  • OJ刷题Day1 · 一维数组的动态和 · 将数字变成 0 的操作次数 · 最富有的客户资产总量 · Fizz Buzz · 链表的中间结点 · 赎金信
  • 【数据结构】栈——必做题
  • LearnOpenGL 笔记 - 入门 04 你好,三角形
  • keepalived+mysql高可用
  • JAVA工具篇--1 Idea中 Gradle的使用
  • 弄懂自定义 Hooks 不难,改变开发认知有点不习惯
  • Java面向对象基础
  • 基于python下selenium库实现交互式图片保存操作(批量保存浏览器中的图片)
  • 一:Datart的下载、本地运行