当前位置: 首页 > news >正文

Python day39

@浙大疏锦行 python day39.

        图像数据介绍:区别于机器学习中的数据(特征1,特征2,,,),单个图像数据通常有三维,即(C,H,W)分别代表了通道数、高度以及宽度;而在大规模训练中通常会按照batch的形式训练,此时为四维(B,C,H,W);

        使用MLP神经网络时,就需要将上面的多维数据展平为一维数据(Flatten);

        使用batch训练的模式时,模型的定义并不需要修改,只需要在Dataloader中设置batch size大小即可,Pytorch会自动进行处理,每次从Dataloader中读取batch size大小的数据;

        显存可以看作GPU使用的内存,如果训练过程中显存不够,则会爆出OOT的错误;针对训练过程中占用的显存大致包括如下部分:模型的参数,梯度,优化器状态,输入的数据以及前向传播反向传播中的中见变量,如果不能选择合适的设置可能会导致无法训练;主要通过调整batch size的大小来调整显存的占用,通常合适的 batch_size = 硬件显存允许的最大值 × 0.8(预留安全空间);

        使用batch进行训练时,更新参数所用的梯度为batch内每个样本梯度的平均值,因此使用batch或者较大的batch训练的好处就是可以训练更稳定更迅速,但是相应的显存占用也会增多。

http://www.lryc.cn/news/615591.html

相关文章:

  • PG靶机 - Shiftdel
  • 大语言模型提示工程与应用:前沿提示工程技术探索
  • AcWing 4579. 相遇问题
  • Horse3D引擎研发笔记(三):使用QtOpenGL的Shader编程绘制彩色三角形
  • 企业级高性能web服务器
  • 香橙派 RK3588 部署千问大模型 Qwen2-VL-2B 推理视频
  • Kubernetes CronJob bug解决
  • 前端工程化:从构建工具到性能监控的全流程实践
  • 应用层Http协议(1)
  • Spring框架基础
  • 黑马SpringAI项目-聊天机器人
  • 力扣热题100------70.爬楼梯
  • Day38--动态规划--322. 零钱兑换,279. 完全平方数,139. 单词拆分,56. 携带矿石资源(卡码网),背包问题总结
  • 原生Vim操作大全
  • 大模型“涌现”背后的暗线——规模、数据、目标函数的三重协奏
  • 算法_python_学习记录_02
  • linux 操作ppt
  • Uipath Studio中邮件自动化
  • HTML全景效果实现
  • Android 开发问题:The specified child already has a parent.
  • 202506 电子学会青少年等级考试机器人五级器人理论真题
  • NX二次开发——面有关的函数
  • C++的结构体指针
  • 密集遮挡场景识别率↑31%!陌讯轻量化部署方案在智慧零售的实战解析
  • Linux文件操作详解:一切皆文件
  • app功能测试工具
  • 智慧水务漏检率↓75%:陌讯水下视觉监测方案实战解析
  • 动态规划(相同地方不同状态)
  • Web前端之Vue框架
  • 【牛客刷题】小红的区间删除