当前位置: 首页 > article >正文

Day34打卡 @浙大疏锦行

知识点回归:

  1. CPU性能的查看:看架构代际、核心数、线程数
  2. GPU性能的查看:看显存、看级别、看架构代际
  3. GPU训练的方法:数据和模型移动到GPU device上
  4. 类的call方法:为什么定义前向传播时可以直接写作self.fc1(x)

作业

 

  1. 计算资源分配与调度:虽然losses.append(loss.item()) 是同步操作,但 GPU 和 CPU 之间的资源分配与调度并非简单线性。每次记录操作时,系统可能会根据当前整体负载、其他进程占用资源情况等动态调整资源分配。比如,即使记录次数减少,如果此时系统中其他任务占用了 CPU 或 GPU 资源,也会影响计算时长,导致剩余时长不按记录次数成比例变化。
  2. 硬件特性与缓存机制:硬件层面的缓存机制会影响计算速度。当记录间隔不同时,数据在缓存中的命中情况会变化。记录间隔小,数据频繁访问,可能存在缓存未及时更新或频繁失效的情况;记录间隔大,数据访问间隔长,缓存可能在较长时间内保持有效。这些都会对实际计算时间产生影响,破坏记录次数和剩余时长的线性关系。
  3. 计算任务的复杂性与动态性:深度学习训练中的计算任务并非完全均一。不同的记录间隔下,每次计算涉及的数据量、计算图的构建与执行等可能存在差异。比如,间隔小的时候,每次计算的数据可能存在更多中间依赖,计算图更复杂,即使记录次数多,也不一定能简单按比例反映在剩余时长上。

@浙大疏锦行

http://www.lryc.cn/news/2384803.html

相关文章:

  • 【Jitsi Meet】(腾讯会议的平替)Docker安装Jitsi Meet指南-使用内网IP访问
  • AdGuard解锁高级版(Nightly)_v4.10.36 安卓去除手机APP广告
  • C++修炼:红黑树的模拟实现
  • 基于Python+YOLO模型的手势识别系统
  • 自制操作系统day10叠加处理
  • docker初学
  • ## Docker 中 Elasticsearch 启动失败:日志文件权限问题排查与解决
  • 鸿蒙Flutter实战:23-混合开发详解-3-源码模式引入
  • leetcode:2469. 温度转换(python3解法,数学相关算法题)
  • 【软件安装】Windows操作系统中安装mongodb数据库和mongo-shell工具
  • 跨域问题及其CORS解决方案:gin框架中配置跨域
  • 记共享元素动画导致的内存泄露
  • Flyweight(享元)设计模式 软考 享元 和 代理属于结构型设计模式
  • Win/Linux安装flash attention2
  • 【原创】ubuntu22.04下载编译AOSP 15
  • 服务器网络配置 netplan一个网口配置两个ip(双ip、辅助ip、别名IP别名)
  • 响应面法(Response Surface Methodology ,RSM)
  • 针对面试-java集合篇
  • Spring Boot 拦截器:解锁5大实用场景
  • 展锐 Android 15 锁定某个App版本的实现
  • 有两个Python脚本都在虚拟环境下运行,怎么打包成一个系统服务,按照顺序启动?
  • 【Linux cmd】查找进程信息
  • 与网格共舞 - 服务网格的运维与问题排查 (Istio 实例)
  • Python 脚本执行命令的深度探索:方法、示例与最佳实践
  • PotPlayer 4K 本地万能影音播放器
  • 2025年电工杯A题第一版本Q1-Q4详细思路求解+代码运行
  • 基于阿里云DashScope API构建智能对话指南
  • HOW - 基于组件库组件改造成自定义组件基本规范
  • 九州未来十三载:开源赋能 智启未来
  • 2025年AI搜索引擎发展洞察:技术革新与市场变革