当前位置: 首页 > news >正文

【深度学习基础】

打基础日常记录

  • CNN基础知识
    • 1. 感知机
    • 2. DNN 深度神经网络(全连接神经网络)
      • DNN 与感知机的区别
      • DNN特点,全连接神经网络
      • DNN前向传播和反向传播
    • 3. CNN结构【提取特征+分类】
    • 4. CNN应用于文本
  • RNN基础
    • 1. RNN的本质
  • 词向量模型word2Vec
    • 1. 自然语言处理需要解决的问题
    • 2. 如何解决上述问题
    • 3. 词向量是什么(训练成词向量)
    • 4. 神经网络做什么?
    • 5. 模型如何去训练词向量
    • 6. 构建训练数据
    • 7. 浩大的语料库中,

CNN基础知识

1. 感知机

单层感知机就是一个二分类器,接收输入向量,输出分类结果,先进行线性加权,再进行激活函数的非线性转换,就相当于是一个小模型,里面的权重w和b是模型的参数
参考1
图1
参考2
在这里插入图片描述

2. DNN 深度神经网络(全连接神经网络)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

DNN 与感知机的区别

在这里插入图片描述

DNN特点,全连接神经网络

在这里插入图片描述

DNN前向传播和反向传播

在这里插入图片描述

3. CNN结构【提取特征+分类】

3.1 CNN特有的卷积层,
3.2 卷积层自带卷积核和relu激活函数,
3.3 CNN特有的池化层(池化层没有激活函数)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4. CNN应用于文本

在这里插入图片描述

RNN基础

1. RNN的本质

常用在NLP中,应为NLP是处理语句的,语句之间有先后顺序,RNN可以在预测中加入先后顺序的信息
在这里插入图片描述
–分割线–
在这里插入图片描述
–分割线–
在这里插入图片描述
–分割线–

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

词向量模型word2Vec

把单词转换成向量,也就是一个一个的数值,计算机知道这些数值的含义,人类不需要理解

1. 自然语言处理需要解决的问题

  1. 单词之间应该有先后的顺序,而不是用词频;
  2. 意思相近的单词在空间中的表示也应该相近;

2. 如何解决上述问题

  1. 把单词变成向量,计算两个向量之间的相似度;(解决问题2)

3. 词向量是什么(训练成词向量)

词向量就是在规定的维度内,通常是50-300维度,把单词变成数值,计算机可以认识
在这里插入图片描述
在这里插入图片描述

4. 神经网络做什么?

输入两个单词,预测第三个单词

5. 模型如何去训练词向量

  1. 先有一个词向量库(随机初始化的),Look up embedding, 从中查找到输入词的向量,词向量输入到网络中,预测下一个词向量是什么,通过loss更新网络的权重参数以及词向量库
    在这里插入图片描述
    词训练数据库,是任何正常说话的逻辑数据都可以当成训练数据

6. 构建训练数据

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

7. 浩大的语料库中,

在这里插入图片描述

http://www.lryc.cn/news/334444.html

相关文章:

  • 银行业架构网络BIAN (Banking IndustryArchitecture Network)详细介绍
  • [尚硅谷 flink] 基于时间的合流——双流联结(Join)
  • 怎样恢复已删除的照片?教你3个方法,一键恢复!
  • 植物糖基转移酶数据库-23年-地表最强系列-文献精读-6
  • 虚拟机打不开
  • MySQL数据库版本为5.5.62,时间戳超出2038年1月19日的解决方案
  • C++20 semaphore(信号量) 详解
  • 【简单讲解下Lisp的学习历程】
  • 构建高效网络:深入理解正向与反向代理的作用与配置
  • Linux:make/makefile的使用
  • Java设计模式—策略模式(商场打折)
  • FOR循环
  • C++: 命名空间/C++输入输出/缺省参数/函数重载/引用/内联函数
  • Java | Leetcode Java题解之第13题罗马数字转整数
  • 题目:学习使用register定义变量的方法。
  • IO_DAY7
  • 大模型学习笔记八:手撕AutoGPT
  • Java常用API_System——常用方法及代码演示
  • neo4j图数据库下载安装配置
  • 结构化面试-有矛盾的人际沟通题
  • AI技术创业机会之金融科技
  • LC低通滤波
  • CS162 Operating System笔记
  • mysql慢sql排查与分析
  • 基于Springboot+Vue实现前后端分离酒店管理系统
  • 2024泰迪杯c题详细思路代码讲解:竞赛论文的辅助自动评阅
  • 【GEE实践应用】GEE下载遥感数据以及下载后在ArcGIS中的常见显示问题处理(以下载哨兵2号数据为例)
  • Excel 文件底部sheet 如何恢复
  • spring boot3登录开发-3(2短信验证登录/注册逻辑实现)
  • ChernoCPP 2