当前位置: 首页 > news >正文

MachineLearningWu_14/P65-P69_Multiclass

x.1 Multiclass多分类问题

对于分类问题,往往指的是二分类问题,而对于二分类的decision boundary较为简单,而实际生活中会有很多问题是多分类问题,例如MNIST手写数字识别,

请添加图片描述

从特征空间上来看,二分类和多分类的区别在于边界函数的不同,但是表现在实际的神经网络的代码中,只是最后一层采用的激活函数不同,从sigmoid变成了softmax函数,即从将负无穷到正无穷映射到0,1变成了映射到一个总和为1的概率中。

请注意,激活函数层并没有可学习参数,一些ReLU变体可能有少量可学习参数。

我们来看一下将softmax和全连接层结合使用,在具体实现中,如果你有4个类别,则softmax会有四个可学习weight和bias,他们分别输出4个不同的数值向量a,将这四个输出的输出进行处理变为4个元素,总和为1的概率向量b,这里的概率向量b就是softmax最后的输出。但这里其实容易让人误导,即我们使用全连接层产生了4个输出向量a,我们将a变为b这个过程才叫softmax,softmax层本身并没有可学习参数。

请添加图片描述

我们再讲一个softmax的损失函数,即等于该类别正确时的-log,是MSE估计出来的,如下,

请添加图片描述

从神经网络上再来区分一下二分类和多分类,上面是二分类,下面是多分类,

请添加图片描述

请添加图片描述

在代码实现上,我们将Dense层和Softmax一块使用,但要注意softmax并没有可学习参数,

请添加图片描述

但是我们为何要将最后一层的总和一定要是1呢,不是1我们也能分类呀,而且精度更高,于是将最后一层换成Linear我们仍然可以多分类,

请添加图片描述

http://www.lryc.cn/news/116752.html

相关文章:

  • 深入理解高并发编程 - SimpleDateFormat 类的线程安全问题
  • 接口幂等性实现方式
  • redis高可用之持久化
  • Cocos Creator 3.8 后期效果 Shader 编写(2/2) 进阶篇
  • 【JS自用模板】自动点击选课的操作模板
  • TENNECO EDI 项目——X12与XML之间的转换
  • C++项目:在线五子棋对战(网页版)
  • flutter遇到的小问题记录
  • Golang bitset 基本使用
  • sql 分组讨论,二级分组(非2个字段分组),使用 窗口函数和普通分组实现
  • 业务中如何过滤敏感词
  • 用服务器搭建网站需要做什么
  • clickhouse 删除操作
  • C 语言中,「.」与「->」有什么区别?
  • github pages 用法详解 发布自己的网站
  • 坤简炫酷的JQuery轮播图插件
  • C# 条件编译
  • IntelliJ IDEA如何重新弹出git身份验证窗口
  • 【雕爷学编程】Arduino动手做(200)---WS2812B幻彩LED灯带4
  • 【雕爷学编程】Arduino动手做(201)---DFRobot 行空板03
  • Spring中Bean的“一生”(生命周期)
  • 安卓:LitePal操作数据库
  • 【JavaEE初阶】了解JVM
  • 基于vue2.0和elementUi的vue农历日期组件vue-jlunar-datepicker(插件)
  • Python爬虫——selenium_元素定位
  • 短视频内容平台(如TikTok、Instagram Reel、YouTube Shorts)的系统设计
  • 【git】Git 回退到指定版本:
  • kibana+nginx配置密码 ubuntu
  • Git仓关联多个远程仓路径
  • 使用ffmpeg将m4a及wav等文件转换为MP3格式