当前位置: 首页 > article >正文

GPU加速与非加速的深度学习张量计算对比Demo,使用PyTorch展示关键差异


import torch
import time

# 创建大型随机张量 (10000x10000)
tensor_size = 10000
x_cpu = torch.randn(tensor_size, tensor_size)
x_gpu = x_cpu.cuda()  # 转移到GPU

# CPU矩阵乘法
start = time.time()
result_cpu = torch.mm(x_cpu, x_cpu.t())
cpu_time = time.time() - start

# GPU矩阵乘法
torch.cuda.synchronize()  # 确保GPU计时准确
start = time.time()
result_gpu = torch.mm(x_gpu, x_gpu.t())
torch.cuda.synchronize()
gpu_time = time.time() - start

print(f"CPU计算时间: {cpu_time:.4f}秒")
print(f"GPU计算时间: {gpu_time:.4f}秒")
print(f"加速比: {cpu_time/gpu_time:.1f}倍")
 

http://www.lryc.cn/news/2402429.html

相关文章:

  • Vue中的自定义事件
  • 2025年大模型平台落地实践研究报告|附75页PDF文件下载
  • PPTAGENT:让PPT生成更智能
  • Kotlin 中 companion object 扩展函数和普通函数区别
  • 《汇编语言》第13章 int指令
  • Redis实战-基于redis和lua脚本实现分布式锁以及Redission源码解析【万字长文】
  • Ubuntu崩溃修复方案
  • 计算机网络 : 应用层自定义协议与序列化
  • Python Day42 学习(日志Day9复习)
  • CMake在VS中使用远程调试
  • 《图解技术体系》How Redis Architecture Evolves?
  • 从零搭建到 App Store 上架:跨平台开发者使用 Appuploader与其他工具的实战经验
  • Spring Cloud 2025 正式发布啦
  • 一文速通Python并行计算:12 Python多进程编程-进程池Pool
  • 相机Camera日志分析之二十五:高通相机Camx 基于预览1帧的process_capture_request四级日志分析详解
  • React从基础入门到高级实战:React 实战项目 - 项目一:在线待办事项应用
  • 云部署实战:基于AWS EC2/Aliyun ECS与GitHub Actions的CI/CD全流程指南
  • golang 如何定义一种能够与自身类型值进行比较的Interface
  • Web前端之原生表格动态复杂合并行、Vue
  • 『uniapp』把接口的内容下载为txt本地保存 / 读取本地保存的txt文件内容(详细图文注释)
  • C/C++ 面试复习笔记(2)
  • 宝马集团推进数字化转型:强化生产物流与财务流程,全面引入SAP现代架构
  • 【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现(服务端执行命令请求的过程 - 时间事件处理部分)
  • 【DAY40】训练和测试的规范写法
  • C语言 标准I/O函数全面指南
  • el-select 实现分页加载,切换也数滚回到顶部,自定义高度
  • Langchaine4j 流式输出 (6)
  • Jenkins:自动化流水线的基石,开启 DevOps 新时代
  • 学习经验分享【40】目标检测热力图制作
  • C#里与嵌入式系统W5500网络通讯(3)