当前位置: 首页 > news >正文

机器学习 vs 深度学习

目录

一、机器学习

1、实现原理

2、实施方法

二、深度学习

1、与机器学习的联系与区别

2、神经网络的历史发展

3、神经网络的基本概念


一、机器学习

1、实现原理

训练(归纳)和预测(演绎)

  • 归纳: 从具体案例中抽象一般规律。从一定数量的样本(已知模型输入x和模型输出y)中,学习输出y与输入x的关系(可以想象成是某种表达式)。
  • 演绎: 从一般规律推导出具体案例的结果,机器学习中的“预测”亦是如此。基于训练得到的y与x之间的关系,对新的输入x,计算出输出y。通常情况下,如果通过模型计算的输出和真实场景的输出一致,则说明模型是有效的。

2、实施方法

三个关键要素: 假设、 评价、 优化

  1. 模型假设:世界上的可能关系千千万,漫无目标的试探与X之间的关系显然是十分低效的。因此先圈定一个模型能够表达的关系可能,然后机器会进步在假设范围内寻找最优的 Y~X关系,即确定参数w。
  2. 评价函数:即定义损失函数。寻找最优之前,我们需要先定义什么是最优,即评价一个Y~X关系的好坏的指标。通常衡量该关系是否能很好的拟合现有观测样本,将拟合的误差最小作为优化目标。
  3. 优化算法:例如梯度下降。设置了评价指标后,就可以在假设圈定的范围内,将使得评价指标最优(损失函数最小/最拟合已有观测样本)的 Y~X关系找出来,这个寻找最优解的方法即为优化算法。最笨的优化算法即按照参数的可能,穷举每个可能取值来计算损失函数,保留使得损失函数最小的参数作为最终结果

二、深度学习

1、与机器学习的联系与区别

二者在理论结构上是一致的,即:模型假设、评价函数和优化算法;

其根本差别在于假设的复杂度。如下图所示的图像识别问题,给出一张美女照片,人脑可以接收到五颜六色的光学信号,能快速反应出这张图片是一位美女。但对计算机而言,只能接收到一个数字矩阵,对于美女这种高级的语义概念,从像素到高级语义概念中间要经历的信息变换非常复杂,这种变换已经无法用数学公式表达。

在深度学习兴起之前, 很多领域建模的思路是投入大量精力做特征工程, 将专家对某个领域的“人工理解” 沉淀成特征表达, 然后使用简单模型完成任务(如分类或回归)。
而在数据充足的情况下, 深度学习模型可以实现端到端的学习, 即不需要专门做特征工程, 将原始的特征输入模型中, 模型可同时完成特征提取和分类任务。 

2、神经网络的历史发展

3、神经网络的基本概念

人工神经网络包括多个神经网络层, 如: 全连接层、 卷积层、 循环层等, 每一层又包括很多神经元, 超过三层的非线性神经网络都可以被称为深度神经网络。通俗的讲, 深度学习的模型可以视为是输入到输出的映射函数, 如图像到高级语义(美女) 的映射, 足够深的神经网络理论上可以拟合任何复杂的函数。

神经元:

  • 神经网络中每个节点称为神经元, 由两部分组成:
    1)加权和: 将所有输入加权求和;
    2)非线性变换(激活函数): 加权和的结果经过一个非线性函数变换, 让神经元计算具备非线性的能力

多层连接:

  • 大量这样的节点按照不同的层次排布, 形成多层的结构连接起来, 即称为神经网络

前向计算:

  • 从输入计算输出的过程, 顺序从网络前至后

计算图:

  • 以图形化的方式展现神经网络的计算逻辑又称为计算图, 也可以将神经网络的计算图以公式的方式表达Y = f_3(f_2(f_1(w_1x_1 + w_2x_2 + w_3x_3 + b) + \ldots) \ldots)

http://www.lryc.cn/news/525128.html

相关文章:

  • flutter_学习记录_00_环境搭建
  • SpringBoot如何自定义Starter ?
  • 前沿技术对比:大模型技术为什么发展远快于区块链技术,中英对照解释
  • WordPress果果对象存储插件
  • elk 安装
  • Python 预训练:打通视觉与大语言模型应用壁垒——Python预训练视觉和大语言模型
  • OpenCV相机标定与3D重建(63)校正图像的畸变函数undistort()的使用
  • 用 Java 发送 HTML 内容并带附件的电子邮件
  • 【Day24 LeetCode】贪心Ⅱ
  • vue3+elementPlus之后台管理系统(从0到1)(day3-管理员管理)
  • 上位机知识篇---ROS2命令行命令静态链接库动态链接库
  • 2025/1/21 学习Vue的第四天
  • 云计算、AI与国产化浪潮下DBA职业之路风云变幻,如何谋破局启新途?
  • Linux内核编程(二十一)USB驱动开发-键盘驱动
  • 模拟算法习题篇
  • 蓝桥杯真题 - 翻转 - 题解
  • IP属地与视频定位位置不一致:现象解析与影响探讨
  • 管道符、重定向与环境变量
  • 可扩展性设计架构模式——开闭原则
  • 算法随笔_17: 回文数
  • 计算机的错误计算(二百一十九)
  • React进阶之高阶组件HOC、react hooks、自定义hooks
  • 【Pytest】基础到高级功能的理解使用
  • RHCE实验详解
  • 备赛蓝桥杯之第十五届职业院校组省赛第二题:分享点滴
  • MyBatis 注解开发详解
  • Kivy App开发之UX控件VideoPlayer视频播放
  • 简单排序算法
  • C语言初阶牛客网刷题——JZ17 打印从1到最大的n位数【难度:入门】
  • 基于springboot+vue的校园二手物品交易系统的设计与实现