当前位置: 首页 > news >正文

【08-神经网络介绍】

前言

神经网络的工作原理,如何进行推理和预测;

如何训练自己的神经网络;

构建机器学习系统的实际建议;

学习决策树;

神经网络,模仿大脑工作的软件

语音识别 -> 图像识别 -> 文本NLP -> …

大脑如何工作:神经元 - 突触 - 神经元 ,许许多多神经元相互连接形成的网络,相互传输电信号;

1990 年,神经网络 - 2005 深度学习 -

数据量的爆发,以及神经网络可以增加神经元的数目,并利用大量的数据,可以不断提高该模型的性能;
在这里插入图片描述

工作原理

神经网络的工作原理

需求预测:某T-shit的销量好不好;

a, activation, 术语,指一个神经元向下游的其他神经元发送高输出的程度(频率?密度?);

a = f(x) = 1 / (1 + e^-(wx+b));

使用逻辑回归来预测,输入价格x,输出卖地好的概率值,这件事给一个神经元节点来做;也可以将神经元理解为小型计算机,负责将输入的值经过计算之后输出;

构建一个神经网络:将这些神经元连结在一起;

例子2:预测T-shit销量好不好;

输入特征:价格price, 运费shipping cost, 营销marketing,材料material;

第一个神经元:特征为价格和运费,作为消费者的成本;affordability

第二个神经元:特征为营销,作为消费者的感知度;awareness

第三个神经元:特征为价格和材料,作为消费者的认为是否是高质量的;perceived quality
在这里插入图片描述

在神经网络的术语中,将 affordability、awareness、perceived quality 称为 activations;

生物上,activations 指生物神经元发送高输出值/给下游许多神经元发送许多电脉冲的程度;

这三个神经元的输出被称为 affordability、awareness、perceived quality 的激活值activations;

最后输出的概率是第二层神经元的activation激活值;

目前为止,我们必须逐个神经元决定它从上一层获取哪些输入,实际上,由很多特征参数和神经元时,对每个神经元逐个决定它的入参是一项非常耗时切繁杂的工作,而在实际的操作中,每个神经元都可以获取到上一层神经元的所有的值,

更改为:输入为一个特征向量x,其中有四个值;向量x输入到中间层,每个神经元根据自己的侧重点来调整其他特征值的参数(例如对于affordability节点,可调整marketing material的参数很小),然后输出三个节点的激活值,这三个激活值再作为最后一个节点的入参,最后输出大卖概率;

它有三层,第一层是一个特征向量(包含四个值),第二层的输入是包含四个值的特征向量,输出三个激活值,第三层输入三个激活值,输出概率。

输入层,隐藏层,输出层。
在这里插入图片描述

对于给定的数据集而言,有一组数据:价格,运费,营销费,材料,以及销量(或是否大卖);

对于神经网络模型而言,一些中间参数和变量,如 affordability, awareness, perceived quality ,即输出节点的入参数据,是未知的,对于训练集而言,这些值是隐藏的。

当先暂时不看第一层时,它就是几个逻辑回归模型节点的组合,但是它的入参 affordability, awareness, perceived quality 是未知的,且相对于原始特征而言,这是一组新的特征,这些新的特征可能对于预测它是否大卖有更好的效果,但是它是一个可以学习自己特征的逻辑回归的版本,它更容易做出准确的预测。

在特征工程中,如何选择特征是一个问题,而在神经网络中,不需要手动设计特征,它可以学习它自己的特征,使得它学习问题更容易。

需要注意的是,虽然我们刚刚人工指定了隐藏层的特征affordability, awareness, perceived quality ,但在实际的神经网络中,你不需要明确决定哪些是特征,它会自己找出在这个隐藏层中想要使用的特征,这也是它成为如此强大的学习算法的原因

构建神经网络模型时,需要决定,需要几个隐藏层,每个隐藏层有几个神经元;

具备多个层的神经网络被称为多层感知器multi-layer perceptron;

每一层输入一个数字向量,并对其应用一系列逻辑回归单元,然后计算另一个数字向量,然后从一层传递到另一层,直到得到最终输出层的计算。

卷积层

其他特性的层类型

上述讲的都是密集层神经网络,它将上一层中的所有激活值作为自己的输入。

其他特性的层类型,比如卷积层,

每个神经元的输入不是所有的输入信息,而是其中一部分;

1、可以加快计算速度;

2、使用这种层类型的神经网络称为卷积层;

使用了多个卷积层的神经网络称为卷积神经网络;

心电图EKG信号分类
在这里插入图片描述

事实证明,对于卷积层,有许多架构选择,如单个神经元的输入窗口的大小、每一层有几个神经元;

通过选择不同的参数可以构建不同的卷积层和卷积网络;

要点:神经网络可以有其他的层,以及不同的架构,例如,Transformer model . LSTM/注意力模型。

在机器学习项目中如何决策

how to build mechine learning system

决策技巧

http://www.lryc.cn/news/617787.html

相关文章:

  • STM32 HAL库 HAL_TIM_OC_Start函数解读
  • maven项目打包成sdk后在别的项目使用
  • 深度解析三大HTTP客户端(Fetch API、Axios 和 Alova)——优劣与选择策略
  • 【03】厦门立林科技——立林科技 嵌入式 校招笔试,题目记录及解析
  • REDIS 各种数据结构有什么作用?都能干什么?
  • 写一篇Ping32和IP-Guard的对比,重点突出Ping32
  • 使用行为树控制机器人(一) —— 节点
  • 芯片学习 8 :IP集成、cluster、lint
  • 大语言模型(LLM)核心概念与应用技术全解析:从Prompt设计到向量检索
  • AI入门学习--如何写好prompt?
  • MySQL 数据操作全流程:创建、读取、更新与删除实战
  • 高精度蓝牙定位:技术、应用与未来发展
  • 【Docker实战进阶】Docker 实战命令大全
  • 从零构建企业级K8S:高可用集群部署指南
  • LeetCode算法日记 - Day 8: 串联所有单词的子串、最小覆盖子串
  • kubeadm搭建生产环境的双master节点k8s高可用集群
  • Android视频编辑方案测评:轻量化剪辑工具的性能表现
  • LAZADA跨境电商自养号测评环境搭建:安全与合规的底层逻辑解析
  • Centos8系统在安装Git包时,报错:“没有任何匹配: git”
  • 【图像处理基石】UE输出渲染视频,有哪些画质相关的维度和标准可以参考?
  • LVPECL、LVDS、LVTTL、LVCMOS四种逻辑电平标准的全面对比
  • redis(1)-基本概念
  • ESP32 输入密码后执行程序
  • 【bug】diff-gaussian-rasterization Windows下编译 bug 解决
  • 苹果个人开发者如何实现应用下载安装
  • 【Unity】打包学习笔记
  • IEEE754 double 类型步长规律,从1.0的二进制表示、紧挨着1.0略大和略小的数开始归纳
  • perl notes【1】
  • 【linux】企业级WEB应用服务器tomcat
  • 达梦数据库慢SQL日志收集和分析