当前位置: 首页 > news >正文

李沐动手学习深度学习——3.2练习

以下是个人理解,希望进行讨论求解。

练习

1. 如果我们将权重初始化为零,会发生什么。算法仍然有效吗?

在这里插入图片描述
根据SGD算法公式如上,第一次迭代的值可知w只与b相关,而对于b的迭代更新,只是与b的初始值相关,x没有参与迭代的计算过程中,不能够达到收敛的目的。
进行运行可以如下结果:
在这里插入图片描述
在这里插入图片描述

2. 假设试图为电压和电流的关系建立一个模型。自动微分可以用来学习模型的参数吗?

显而易见可行,因为 UR=I,I和U的关系是线性关系。

3. 能基于普朗克定律使用光谱能量密度来确定物体的温度吗?

能基于普朗克定律使用光谱能量密度如下:
在这里插入图片描述
在这里插入图片描述
推导公式最后如下,可得其u与T之间是线性关系,是正比情况,所以可以利用SGD的方法通过数据进行拟合。

在这里插入图片描述

4. 计算二阶导数时可能会遇到什么问题?这些问题可以如何解决?

显而易见存在一阶导数光滑,但是二阶导数曲线不光滑的情况,类似于一阶导数驻点突变问题。利用阈值判断停止计算,或者调整学习率等,参考上一章的答案。以上是我能够想到的问题。显然不是足够,所以动用一下gpt帮忙:
在这里插入图片描述

5. 为什么在squared_loss函数中需要使用reshape函数?

要将真实值y的形状转换为和预测值y_hat的形状相同。根据函数矩阵计算可知,x是102大小,w是21,得出的y_hat是101,但是y是110,所以需要转置。

6. 尝试使用不同的学习率,观察损失函数值下降的快慢。

学习率0.01的时候
在这里插入图片描述
学习率0.02的时候
在这里插入图片描述
可知道收敛速度不同,收敛精度不同

7. 如果样本个数不能被批量大小整除,data_iter函数的行为会有什么变化?

修改代码batch_size设置为11,进行运行,发现可运行,说明了最后一个batch直接被运算抛弃了,不参与计算。
在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/308091.html

相关文章:

  • 代码随想录Day20 | Leetcode77 组合
  • Android Duplicate class 排除重复类
  • 【Kubernetes】服务(Service)是什么?有什么用?有哪些类型?
  • 【前端素材】推荐优质后台管理系统DAdmin平台模板(附源码)
  • Redis高级特性详解:事务处理、发布订阅、持久化和集群
  • nwjs做自动化测试
  • 【前端素材】推荐优质在线特殊品牌商城电商网页eStore平台模板(附源码)
  • Redis之一: 简介及环境安装搭建
  • 关于电脑一天24小时多少度电电脑的一天用电量计算
  • Unity3D 物理引擎的基本配置详解
  • CSS:弹性盒子Flexible Box布局
  • java常用环境docker安装
  • Code-Audit(代码审计)习题记录6-7
  • go 的使用总结
  • 无线水电表智能化管理系统
  • 发掘效率黑科技:Allure报告助您事半功倍提升测试效能!
  • Spring Web 过滤器使用常见错误(上)
  • 【数据结构】周末作业
  • java 企业培训管理系统Myeclipse开发mysql数据库web结构jsp编程计算机网页项目
  • 在SAP HANA中使用OData(二)
  • 【Docker】前端基于dockerfiel构建镜像部署,实现在容器启动时传递环境变量, 请求不同服务地址
  • 评估测试接口软件与网站的使用方法及优劣势比较
  • 【Qt学习】QLineEdit 控件 属性与实例(登录界面,验证密码,正则表达式)
  • Spring Boot 和 Spring Cloud: 区别与联系
  • 9.网络游戏逆向分析与漏洞攻防-游戏网络架构逆向分析-接管游戏连接服务器的操作
  • vue - - - - - vue3使用draggable拖拽组件
  • PHP语言常见面试题:请解释一下PHP是什么,以及它的主要用途是什么?
  • Unity(第六部)向量的理解和算法
  • TypeScript+React Web应用开发实战
  • android开发电子书,android基础编程