当前位置: 首页 > news >正文

【GPU编程】Visual Studio创建基于GPU编程的项目

vs创建基于GPU编程的项目

  • 🍊前言
  • 🐸方法一-CUDA Runtime生成
    • 😝debug设置
  • 🍅方法二-空项目配置
  • 🍉🍉🍉代码验证

🍊前言

cuda以及cudnn的安装以及系统环境变量的配置默认已经做完。如果没有安装好配置好的,可以参考其他的博客。本博客只为记录在完成以上配置后,如何在vs端创建GPU编程的项目。

🐸方法一-CUDA Runtime生成

我们打开vs,点击创建新项目:
在这里插入图片描述
然后在右侧选择到cuda runtime,具体是什么版本 看你装的是什么版本 因人而异:
在这里插入图片描述
创建完毕后,软件会自动生成一段基于GPU编程的代码,运行之后如果能正常出结果,说明你的CUDA安装和CUDNN的安装与系统环境配置没有问题了:
在这里插入图片描述
运行这个.cu后缀名的代码,得到结果:
在这里插入图片描述
则说明我们的第一个CUDA编程的代码跑通了。

😝debug设置

我们创建完项目之后,正常运行没问题的话,就可以开始完成我们的GPU编程了,但在写代码的过程中,难免会遇到bug,这时候如果我们想通过打断点的方式去调试,程序却无法在断点处终止,而是每次都执行完毕,这是因为我们创建的项目默认给我们设置了无法debug的模式,我们只需要点击项目:
在这里插入图片描述
打开项目属性:
在这里插入图片描述
把红箭头指向的地方选择是。
在这里插入图片描述
这边也同样将选择的地方选择成是。

🍅方法二-空项目配置

创建好之后,我们右键项目名称,选择生成依赖项,再选择生成自定义:
在这里插入图片描述
勾选我们想要的CUDA版本。
点击空项目创建好项目之后,右键源文件,创建一个.cu为后缀名的代码文件:
在这里插入图片描述
名称自己随便定义。
右键点击刚才创建好的.cu后缀名的文件,选择属性,点击常规,在项类型中选择CUDA C/C++即可:
在这里插入图片描述
然后打开项目属性页,开始配置路径:
首先是包含目录:
在这里插入图片描述
然后是库目录:
在这里插入图片描述
然后是链接器的附加库目录:
在这里插入图片描述
然后,我们在桌面或者随便在哪个可以创建txt的地方,新建一个txt文件夹,命名为res.txt:
在这里插入图片描述
将这个txt复制到这个路径下:
在这里插入图片描述
打开终端,cd到这个路径里面,输入:

DIR *.lib /B > res.txt

在这里插入图片描述
然后我们再打开res.txt,则可以发现里面已经写入了这个路径下的所有lib依赖项的名字了。
在这里插入图片描述
然后我们复制所有的这些名称,拷贝到链接器-输入的附加依赖项中:
在这里插入图片描述
最后点击应用,然后确定。
最后记得将这两个位置设置成一样的:
在这里插入图片描述
设置debug的方式见方法一的最后。

🍉🍉🍉代码验证

这里我们准备一串基于GPU编程的代码:

#include <device_launch_parameters.h>
#include <cuda_runtime.h>
#include <iostream>
#include <cuda.h>
#include <vector>using namespace std;//基于GPU的矢量求和
#define N 10__global__ void add(int* a_ptr, int* b_ptr, int* c_ptr)
{int tid = blockIdx.x;if (tid < N){c_ptr[tid] = a_ptr[tid] + b_ptr[tid];}
}int main()
{/*std::vector<int> a(N), b(N), c(N);int* a_ = &a[0], * b_ = &b[0], * c_ = &c[0];*/int a[N], b[N], c[N];int* a_ptr, * b_ptr, * c_ptr;//在CPU上分配内存cudaMalloc((void**)&a_ptr, N * sizeof(int));cudaMalloc((void**)&b_ptr, N * sizeof(int));cudaMalloc((void**)&c_ptr, N * sizeof(int));//在cpu上为数组赋值for (int i = 0; i < N; i++){a[i] = -i;b[i] = i * i;}//将数组a和数组b复制到GPU上cudaMemcpy(a_ptr, a, N * sizeof(int), cudaMemcpyHostToDevice);cudaMemcpy(b_ptr, b, N * sizeof(int), cudaMemcpyHostToDevice);//N表示在执行核函数时使用的并行线程块的数量。add << <N, 1 >> > (a_ptr, b_ptr, c_ptr);//将运算结果从GPU拷贝到CPUcudaMemcpy(c, c_ptr, N * sizeof(int), cudaMemcpyDeviceToHost);//显示结果for (int i = 0; i < N; i++){cout << a[i] << "+" << b[i] << "=" << c[i] << endl;}cudaFree(a_ptr);cudaFree(b_ptr);cudaFree(c_ptr);return 0;
}

运行之后可以得到结果:
在这里插入图片描述
则说明基于GPU编程的项目创建成功了。

http://www.lryc.cn/news/177693.html

相关文章:

  • MySQL面试题-索引的基本原理及相关面试题
  • MySQL学习笔记19
  • 为什么u盘在mac上显示不出来
  • 【golang】调度系列之sysmon
  • 货物寄到英国选择什么物流比较划算?
  • vite + react 基本项目搭建
  • 一个方法解决三道区间问题
  • sub0 里斯本精彩回顾:探索波卡区块的创新空间
  • 颜色+情感的英语表达还有这些,零基础学英语口语去哪里,柯桥有推荐的吗?
  • exoplayer的使用-6,播放器的选择
  • Windows上安装 Go 环境
  • 【设计模式】四、工厂模式
  • 十九,镜面IBL--BRDF积分贴图
  • Linux 创建 终止线程(thread)
  • 【IPC 通信】信号处理接口 Signal API(6)
  • ipaguard界面概览
  • 萌新的FPGA学习绪论-1
  • 目标检测算法改进系列之Backbone替换为EMO
  • Laravel一些优雅的写法
  • vue+three.js中使用Ammo.js
  • 【k8s】kubectl命令详解
  • Centos 7 部署SVN服务器
  • SEO方案尝试--Nuxtjs项目基础配置
  • 【算法分析与设计】动态规划(上)
  • Java多线程篇(6)——AQS之ReentrantLock
  • 【计算机网络】IP协议第二讲(Mac帧、IP地址、碰撞检测、ARP协议介绍)
  • TouchGFX界面开发 | 按钮控件应用示例
  • BSVD论文理解:Real-time Streaming Video Denoising with Bidirectional Buffers
  • 共同见证丨酷雷曼武汉运营中心成立2周年
  • 一种单键开关机电路图