当前位置: 首页 > news >正文

深度学习今年来经典模型优缺点总结,包括卷积、循环卷积、Transformer、LSTM、GANs等

文章目录

  • 1、卷积神经网络(Convolutional Neural Networks,CNN)
    • 1.1 优点
    • 1.2 缺点
    • 1.3 应用场景
    • 1.4 网络图
  • 2、循环神经网络(Recurrent Neural Networks,RNNs)
    • 2.1 优点
    • 2.2 缺点
    • 2.3 应用场景
    • 2.4 网络图
  • 3、长短时记忆网络(Long Short-Term Memory,LSTM)
    • 3.1 优点
    • 3.2 缺点
    • 3.3 应用场景
    • 3.4 网络图
  • 4、门控循环单元(Gated Recurrent Unit,GRU)
    • 4.1 优点
    • 4.2 缺点
    • 4.3 应用场景
    • 4.4 网络图
  • 5、自注意力模型(Transformer)
    • 5.1 优点
    • 5.2 缺点
    • 5.3 应用场景
    • 5.4 网络图
  • 6、生成对抗网络(Generative Adversarial Networks,GANs)
    • 6.1 优点
    • 6.2 缺点
    • 6.3 应用场景
    • 6.4 网络图
  • 7、人工神经网络
    • 7.1 优点
    • 7.2 缺点
    • 7.3 应用场景
    • 7.4 网络图

1、卷积神经网络(Convolutional Neural Networks,CNN)

1.1 优点

  • 可用于图像处理和计算机视觉领域任务,包括图像分类、人物检索、物体重识别、物体检测和图像分割。
  • 通过卷积层有效捕捉图像中的局部特征(这是跟 transformer 的区别,transformer 关注全局信息)。
  • 具有平移不变性。

1.2 缺点

  • 需要大规模的标记图像数据进行训练。
  • 在其他领域的任务上性能可能不如前馈神经网络。

1.3 应用场景

适用场景:图像分类、目标检测等。
案例:图像识别。将图像分类为不同的物体或场景。

1.4 网络图

《Gradient-based learning applied to document recognition》;LeNet-5
在这里插入图片描述

2、循环神经网络(Recurrent Neural Networks,RNNs)

2.1 优点

  • 适用于序列数据,如自然语言处理和时间序列分析。
  • 具有循环连接,可以处理不定长的序列数据。
  • 具有记忆能力,可以捕捉时间依赖性。

2.2 缺点

  • 梯度消失问题,导致长序列的性能下降。
  • 计算复杂性较高,不适用于大规模数据和深度网络。

2.3 应用场景

适用场景:序列建模、自然语言处理等。
案例:语音识别。将口头语言转换为文本。

2.4 网络图

《Recurrent Neural Networks》
在这里插入图片描述

3、长短时记忆网络(Long Short-Term Memory,LSTM)

3.1 优点

  • 解决了RNN的梯度消失问题。
  • 适用于长序列的建模。
  • 在自然语言处理等领域取得了显著的成功。

3.2 缺点

  • 计算复杂性较高。
  • 需要大量的数据来训练深层 LSTM 网络。

3.3 应用场景

适用场景:处理长序列和时间序列数据。
案例:股票价格预测。预测金融市场的趋势。

3.4 网络图

《Long Short-Term Memory networks》
在这里插入图片描述

4、门控循环单元(Gated Recurrent Unit,GRU)

4.1 优点

  • 类似于 LSTM,但参数较少,计算复杂性较低。
  • 在某些任务上性能与 LSTM 相媲美。

4.2 缺点

  • 对于某些复杂任务,性能可能不如LSTM。

4.3 应用场景

适用场景:用于序列数据处理,与 LSTM 类似。
案例:情感分析。分析文本中的情感。

4.4 网络图

在这里插入图片描述

5、自注意力模型(Transformer)

5.1 优点

  • 适用于自然语言处理和序列建模等任务。
  • 可并行化,计算效率高。
  • 在大规模数据和深度模型上表现出色。

5.2 缺点

  • 需要大规模的数据来训练。
  • 相对较新的模型,可能不适用于所有任务。

5.3 应用场景

适用场景:用于自然语言处理、机器翻译等。
案例:机器翻译。将一种语言的文本翻译为另一种语言。

5.4 网络图

《Attention is All you need》
在这里插入图片描述

6、生成对抗网络(Generative Adversarial Networks,GANs)

6.1 优点

  • 用于生成数据和图像,以及进行无监督学习。
  • 生成高质量的样本。
  • 在图像生成、风格迁移等领域取得了显著的成功。

6.2 缺点

  • 训练复杂性高,稳定性差,需要谨慎调整超参数。
  • 对于某些任务,可能存在模式崩溃问题。
  • 相较于最新的扩散模型,生成的质量和效果不具有竞争性,特定的生成数据可能存在一定的噪声。

6.3 应用场景

适用场景:用于生成图像、音频、文本等。
案例:图像生成。生成逼真的图像。

6.4 网络图

《Generative Adversarial Nets》
在这里插入图片描述

7、人工神经网络

最后,再介绍一种人工神经网络:前馈神经网络(Feedforward Neural Networks,FNNs)。

7.1 优点

  • 适用于各种任务,包括分类和回归。
  • 具有很强的表示能力,可以捕捉复杂的非线性关系。
  • 针对深度学习问题提供了基础。

7.2 缺点

  • 对于小样本数据,容易出现过拟合。
  • 需要大量的标记数据进行训练。

7.3 应用场景

适用场景:用于分类和回归任务。
案例:图像分类。将图像分为不同的类别。

7.4 网络图

在这里插入图片描述

http://www.lryc.cn/news/250671.html

相关文章:

  • ChatGPT成为“帮凶”:生成虚假数据集支持未知科学假设
  • c#利用Forms.Timer定时检测Tcp连接状态
  • 空间注意力:改变我们理解图像的方式
  • 【模型报错记录】‘PromptForGeneration‘ object has no attribute ‘can_generate‘
  • mysql学习记录
  • Hdoop学习笔记(HDP)-Part.11 安装Kerberos
  • 浅谈UML的概念和模型之UML九种图
  • 杨志丰:OceanBase助力企业应对数据库转型深水区挑战
  • 版本控制系统Git学习笔记-Git分支操作
  • 分布式系统中最基础的 CAP 理论及其应用
  • 计算机视觉(OpenCV+TensorFlow)
  • shell语法
  • JAXB的XmlAttribute注解
  • 【代码】基于改进差分进化算法的微电网调度研究matlab
  • 计算机基础知识63
  • springboot虚拟请求——测试
  • 计算机视觉各个方向概述
  • AIGC: 关于ChatGPT中API接口调用相关准备工作
  • 【Java Web学习笔记】 1 - HTML入门
  • 基于windows系统使用Python对于pc当前的所有窗口的相关操作接口
  • 30秒搞定一个属于你的问答机器人,快速抓取网站内容
  • JPA数据源Oracle异常记录
  • 抽奖送平板是骗局!!!
  • json.decoder.JSONDecodeError: Extra data: line 1 column 332 (char 331)
  • rust持续学习 COW
  • 【计算机网络】14、DHCP
  • 【FPGA】Verilog:计数器 | 异步计数器 | 同步计数器 | 2位二进制计数器的实现 | 4位十进制计数器的实现
  • IDEA常用快捷键
  • 【2024秋招】2023-10-17 金山云文档服务端二面
  • 一种excel多线程并发写sheet的方案