当前位置：首页 > news >正文

端到端模型（end-to-end）与非端到端模型

news 2025/8/16 22:15:14

一、端到端（end to end）

从输入端到输出端会得到一个预测结果，将预测结果和真实结果进行比较得到误差，将误差反向传播到网络的各个层之中，调整网络的权重和参数直到模型收敛或者达到预期的效果为止，中间所有的操作都包含在神经网络内部，不再分成多个模块处理。由原始数据输入，到结果输出，从输入端到输出端，中间的神经网络自成一体（也可以当做黑盒子看待），这就是端到端的模型。

优势：
1.只要有足够多的数据，我们不需要知道输入到输出的映射是怎样的，不用引入人类知识，可以充分利用数据本身的信息。

2.所需人工设计的组件更少，能够简化设计工作流程。

二、非端到端(Pipeline)

非端到端是输入->模型A->输出A->模型B->输出B->...->输出。不同于端到端，非端到端可以看作是一个流水线工作，比如在一个典型的NLP问题中，包括分词、词性标注、句法分析、语义分析等多个独立步骤，每个步骤是一个独立的任务，其结果的好坏会影响到下一步骤，从而影响整个训练的结果。

三、序列到序列（seq2seq）

序列到序列是：输入是序列->模型->输出是序列。

序列到序列一种通用的端到端序列学习方法，它基于编码-解码（Encoder - Decoder）的架构。

应用：

示例一：翻译。如果用英文的序列作为输入，用法语的作为标签，进行训练模型。即可得到一个英语到法语的翻译器。

示例二：文本摘要。如果使用一个新闻文章和对应的摘要数据进行训练。可得到一个文章内容摘要器。

示例三：QA问答机器人。使用问题和答案数据集进行训练，可得到一个问答机器人或聊天机器人。

reference：

https://blog.csdn.net/qq_38410428/article/details/91381151

http://www.lryc.cn/news/2064.html

相关文章：

uniApp封装一个滑块组件

运动基元（二）：贝塞尔曲线

Android 11.0 关于Launcher3中调用截图功能总是返回null的解决方案

random随机数

【金三银四系列】Spring面试题-上（2023版）

linux基本功系列之tar命令实战

Prometheus服务发现

【Spring6源码・MVC】请求处理流程源码解析

elasticsearch term match 查询

canal使用说明：MySQL、Redis实时数据同步

计算机视觉框架OpenMMLab开源学习（三）：图像分类实战

LocalDateTime获取时间的年、月、日、时、分、秒、纳秒

MoveIT Rviz和Gazebo联合仿真

ESP32S2(12K)-DS18B20数码管显示温度

linux栈溢出定位

CSS基础：选择器和声明样式

VS中安装gismo库

元学习方法解决CDFSL以及两篇SOTA论文讲解

大数据之------------数据中台

Python 中字符串是什么？

OJ刷题Day1 · 一维数组的动态和 · 将数字变成 0 的操作次数 · 最富有的客户资产总量 · Fizz Buzz · 链表的中间结点 · 赎金信

【数据结构】栈——必做题

LearnOpenGL 笔记 - 入门 04 你好，三角形

keepalived+mysql高可用

JAVA工具篇--1 Idea中 Gradle的使用

弄懂自定义 Hooks 不难，改变开发认知有点不习惯

Java面向对象基础

基于python下selenium库实现交互式图片保存操作（批量保存浏览器中的图片）

一：Datart的下载、本地运行