当前位置: 首页 > news >正文

CUDA原子操作

代码

#include <cuda_runtime.h>
#include <stdio.h>__global__ void atomicAddAndGet(int *result, int *valueToAdd) {// 原子加法int addedValue = atomicAdd(result, *valueToAdd);// 通过原子操作后读取值,确保是加法后的值addedValue += *valueToAdd;printf("Thread %d: Added value: %d\n", threadIdx.x, addedValue);
}int main() {int result = 0;int valueToAdd = 5;int *d_result, *d_valueToAdd;// 在GPU上分配内存cudaMalloc((void**)&d_result, sizeof(int));cudaMalloc((void**)&d_valueToAdd, sizeof(int));// 将数据从主机内存复制到GPU内存cudaMemcpy(d_result, &result, sizeof(int), cudaMemcpyHostToDevice);cudaMemcpy(d_valueToAdd, &valueToAdd, sizeof(int), cudaMemcpyHostToDevice);// 启动CUDA核函数atomicAddAndGet << <1, 32 >> > (d_result, d_valueToAdd);// 将结果从GPU内存复制回主机内存cudaMemcpy(&result, d_result, sizeof(int), cudaMemcpyDeviceToHost);// 输出结果printf("Result after atomic addition: %d\n", result);// 释放GPU上的内存cudaFree(d_result);cudaFree(d_valueToAdd);return 0;
}

结果
在这里插入图片描述

http://www.lryc.cn/news/398552.html

相关文章:

  • 08.C2W3.Auto-complete and Language Models
  • 【linux】log 保存和过滤
  • GeoTrust ——适合企业使用的SSL证书!
  • Kubelet 认证
  • aws slb
  • 【AI大模型】ChatGPT-4 对比 ChatGPT-3.5:有哪些优势
  • 详解yolov5的网络结构
  • 汽车零配件行业看板管理系统应用
  • 【Go】函数的使用
  • 宝塔面板运行Admin.net框架
  • Javaweb11-Filter过滤器
  • 【AI-7】CUDA
  • ctfshow-web入门-文件上传(web164、web165)图片二次渲染绕过
  • 基于实现Runnable接口的java多线程
  • 如何在uniapp中使用websocket?
  • PCL 点云PFH特征描述子
  • linux程序安装-编译-rpm-yum
  • 【网络协议】PIM
  • Redis 中的跳跃表(Skiplist)基本介绍
  • C语言编译和编译预处理
  • ahb 总线的一些思考
  • spark shuffle写操作——SortShuffleWriter
  • ESP32CAM物联网教学12
  • 【C++精华铺】12.STL list模拟实现
  • ChatGPT Mac App 发布!
  • ACE之ACE_Time_Value
  • [论文笔记] 自对齐指令反翻译:SELF-ALIGNMENT WITH INSTRUCTION BACKTRANSLATION
  • 算术运算符. 二
  • 代码优化方法记录
  • qt 图形、图像、3D相关知识