当前位置: 首页 > news >正文

李沐动手学习深度学习——3.6练习

本节直接实现了基于数学定义softmax运算的softmax函数。这可能会导致什么问题?提示:尝试计算exp(50)的大小。

在这里插入图片描述
可能存在超过计算机最大64位的存储,导致精度溢出,影响最终计算结果。

本节中的函数cross_entropy是根据交叉熵损失函数的定义实现的。它可能有什么问题?提示:考虑对数的定义域。

由于对数的定义域是(0, +无穷)。所以可能存在预测结果为0的情况,导致对数计算出错。

请想一个解决方案来解决上述两个问题。

使用归一化操作,可以解决softmax爆炸的问题。对于log函数后添加一个极小值防止计算错误。

返回概率最大的分类标签总是最优解吗?例如,医疗诊断场景下可以这样做吗?

不是的,本质上0.6或者0.4都是存在一定出现的概率,所以在医疗层面上不能使用最绝判断结果,需要阐述出现情况的概率。

假设我们使用softmax回归来预测下一个单词,可选取的单词数目过多可能会带来哪些问题?

当可选取的单词数目过多时,可能会导致模型参数数量过多,增加训练的复杂度。因为输出output的结果变多,模型计算量增大。

http://www.lryc.cn/news/309721.html

相关文章:

  • 机器学习_10、集成学习-Bagging(自举汇聚法)
  • 【力扣hot100】刷题笔记Day20
  • Redis 之八:Jdeis API 的使用(Java 操作 Redis)
  • Docker 应用入门
  • 朱维群将出席用碳不排碳碳中和顶层科技路线设计开发
  • linux如何查看磁盘占用情况
  • 【C++庖丁解牛】类与对象
  • 在什么时候企业档案才会发生调整
  • Linux或Windows下判断socket连接状态
  • 编译链接实战(25)gcc ASAN、MSAN检测内存越界、泄露、使用未初始化内存等内存相关错误
  • [HackMyVM]靶场 VivifyTech
  • 软考高级系统分析师:关联关系、依赖关系、实现关系和泛化关系概念和例题
  • 设计模式学习笔记 - 面向对象 - 9.实践:如何进行面向对象分析、设计与编码
  • 【iOS ARKit】RealityKit 同步机制
  • 【数据结构与算法】整数二分
  • java项目打包运行报异常:xxxxx-1.0-SNAPSHOT.jar中没有主清单属性
  • MAC-键盘command快捷键、设置windows快捷键
  • C++ 补充之常用遍历算法
  • 【Linux杂货铺】调试工具gdb的使用
  • FL Studio Producer Edition2024中文进阶版Win/Mac
  • 无需邀请码,Xinstall实现精准分享归因
  • 机器人与AGI会撞出什么火花?
  • Linux yum安装pgsql出现Bad GPG signature错误
  • 第18章-DHCP
  • [物联网] OneNet 多协议TCP透传
  • 如何让网页APP化 渐进式Web应用(PWA)
  • 50 vmalloc 的实现
  • 程序员的金三银四求职宝典!
  • day04_拦截器Apifox角色管理(登录校验,API接口文档,权限管理说明,角色管理,添加角色,修改角色,删除角色)
  • 在线上传解压PHP文件代码,压缩/压缩(网站一键打包)支持密码登录