当前位置: 首页 > news >正文

opencl 封装简单api

这是cl代码

kernel.c

__kernel void add_one(__global float *output,__global  float* pnum) 
{int x=get_global_id(0);output[x]+=pnum[0];
}

c代码

#include <CL/cl.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include<stdarg.h>typedef struct {cl_platform_id platform_id;cl_device_id device_id;cl_context context;cl_command_queue command_queue;cl_program program;cl_kernel kernel;cl_mem mem_objects[10]; // 假设最多有10个内存对象int mem_count;
} OpenCLContext;// 初始化OpenCL上下文
void cl_init(OpenCLContext *ctx) {cl_int err;ctx->mem_count = 0;// 获取平台IDclGetPlatformIDs(1, &ctx->platform_id, NULL);// 获取设备IDclGetDeviceIDs(ctx->platform_id, CL_DEVICE_TYPE_DEFAULT, 1, &ctx->device_id, NULL);// 创建上下文ctx->context = clCreateContext(NULL, 1, &ctx->device_id, NULL, NULL, &err);if (err != CL_SUCCESS) {fprintf(stderr, "Failed to create OpenCL context\n");exit(EXIT_FAILURE);}// 创建命令队列ctx->command_queue = clCreateCommandQueue(ctx->context, ctx->device_id, 0, &err);if (err != CL_SUCCESS) {fprintf(stderr, "Failed to create OpenCL command queue\n");exit(EXIT_FAILURE);}//ctx->command_queue=1;
}// 加载OpenCL程序
void cl_load(OpenCLContext *ctx, const char *source,char*funcname) {cl_int err;// 创建程序ctx->program = clCreateProgramWithSource(ctx->context, 1, (const char **)&source, NULL, &err);if (err != CL_SUCCESS) {fprintf(stderr, "Failed to create OpenCL program\n");exit(EXIT_FAILURE);}// 构建程序err = clBuildProgram(ctx->program, 1, &ctx->device_id, NULL, NULL, NULL);if (err != CL_SUCCESS) {char build_log[1024];clGetProgramBuildInfo(ctx->program, ctx->device_id, CL_PROGRAM_BUILD_LOG, sizeof(build_log), build_log, NULL);fprintf(stderr, "Failed to build OpenCL program:\n%s\n", build_log);exit(EXIT_FAILURE);}// 创建内核ctx->kernel = clCreateKernel(ctx->program, funcname, &err); // 假设内核名为my_kernelif (err != CL_SUCCESS) {fprintf(stderr, "Failed to create OpenCL kernel\n");exit(EXIT_FAILURE);}
}// 分配OpenCL内存
cl_mem cl_malloc(OpenCLContext *ctx, size_t size) {cl_int err;cl_mem mem = clCreateBuffer(ctx->context, CL_MEM_READ_WRITE, size, NULL, &err);if (err == CL_SUCCESS && ctx->mem_count < 10) {ctx->mem_objects[ctx->mem_count++] = mem;} else {fprintf(stderr, "Failed to allocate OpenCL memory\n");exit(EXIT_FAILURE);}return mem;
}// 向OpenCL内存写入数据
void cl_write(OpenCLContext *ctx, cl_mem mem, const void *data, size_t size) {cl_int err;err = clEnqueueWriteBuffer(ctx->command_queue, mem, CL_TRUE, 0, size, data, 0, NULL, NULL);if (err != CL_SUCCESS) {fprintf(stderr, "Failed to write to OpenCL memory\n");exit(EXIT_FAILURE);}
}// 从OpenCL内存读取数据
void cl_read(OpenCLContext *ctx, cl_mem mem, void *data, size_t size) {cl_int err;err = clEnqueueReadBuffer(ctx->command_queue, mem, CL_TRUE, 0, size, data, 0, NULL, NULL);if (err != CL_SUCCESS) {fprintf(stderr, "Failed to read from OpenCL memory\n");exit(EXIT_FAILURE);}
}// 执行OpenCL内核
void cl_exec(OpenCLContext *ctx, size_t global_work_size, size_t local_work_size, int num_args, ...) {va_list args;cl_int err;va_start(args, num_args);for (int i = 0; i < num_args; i++) {cl_mem mem = va_arg(args, cl_mem);err = clSetKernelArg(ctx->kernel, i, sizeof(cl_mem), (void *)&mem);if (err != CL_SUCCESS) {fprintf(stderr, "Failed to set OpenCL kernel argument\n");exit(EXIT_FAILURE);}}va_end(args);err = clEnqueueNDRangeKernel(ctx->command_queue, ctx->kernel, 1, NULL, &global_work_size, &local_work_size, 0, NULL, NULL);if (err != CL_SUCCESS) {fprintf(stderr, "Failed to execute OpenCL kernel\n");exit(EXIT_FAILURE);}// 等待命令队列完成(可选,取决于是否需要同步)clFinish(ctx->command_queue);
}// 释放OpenCL资源
void cl_free(OpenCLContext *ctx) {for (int i = 0; i < ctx->mem_count; i++) {clReleaseMemObject(ctx->mem_objects[i]);}clReleaseKernel(ctx->kernel);clReleaseProgram(ctx->program);clReleaseCommandQueue(ctx->command_queue);clReleaseContext(ctx->context);
}int main() {OpenCLContext ctx;//cl_int err;// 初始化OpenCL上下文cl_init(&ctx);char code[512];memset(&code,0,sizeof(code));// OpenCL内核源代码(这里应该是一个完整的内核函数定义)const char *kernel_source = &code;FILE*f=fopen("kernel.cl","rb");fread(code,sizeof(code),1,f);fclose(f);// 加载OpenCL程序cl_load(&ctx, kernel_source,"add_one");// 分配OpenCL内存float data[10] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};cl_mem buffer = cl_malloc(&ctx, sizeof(data));cl_mem buf2=cl_malloc(&ctx,sizeof(float));float f2=1;// 向OpenCL内存写入数据cl_write(&ctx, buffer, data, sizeof(data));cl_write(&ctx,buf2,&f2,sizeof(float));// 执行OpenCL内核size_t global_work_size = 10;size_t local_work_size = 1;cl_exec(&ctx, global_work_size, local_work_size, 2, buffer,buf2);// 从OpenCL内存读取数据float result[10];cl_read(&ctx, buffer, result, sizeof(result));// 打印结果for (int i = 0; i < 10; i++) {printf("%f\n", result[i]); // 应该打印出2, 4, 6, 8, 10, 12, 14, 16, 18, 20}puts("-----------------");//cl_write(&ctx, buffer, data, sizeof(data));f2=2;cl_write(&ctx,buf2,&f2,sizeof(float));// 执行OpenCL内核cl_exec(&ctx, global_work_size, local_work_size, 2, buffer,buf2);// 从OpenCL内存读取数据cl_read(&ctx, buffer, result, sizeof(result));// 打印结果for (int i = 0; i < 10; i++) {printf("%f\n", result[i]); // 应该打印出2, 4, 6, 8, 10, 12, 14, 16, 18, 20}puts("-----------------");// 释放OpenCL资源cl_free(&ctx);return 0;
}

http://www.lryc.cn/news/511438.html

相关文章:

  • 超快速的路径优化IKD-SWOpt:SHIFT Planner 中增量 KD 树滑动窗口优化算法详解
  • 精读DeepSeek v3技术文档的心得感悟
  • 【Java数据结构】LinkedList与链表
  • uniapp——微信小程序,从客户端会话选择文件
  • 【CSS in Depth 2 精译_098】17.3:CSS 动画延迟技术与填充模式设置 + 17.4:通过 CSS 动画传递意图的秘诀
  • Oracle考试多少分算通过?
  • 在云服务器中编译IDF(ESP32库)
  • Oracle 日常巡检
  • 机器学习常用术语
  • springboot507基于Springboot教学管理系统(论文+源码)_kaic
  • 工具变量笔记
  • ElasticSearch 统计分析全攻略
  • DataCap MongoDB Driver: 全面解析MongoDB在DataCap中的使用指南
  • DDSort-简单实用的jQuery拖拽排序插件
  • 「下载」智慧园区及重点区域安全防范解决方案:框架统一规划,建设集成管理平台
  • 华为 IPD,究竟有什么特点?(一)
  • Llama 3 后训练(三)
  • Docker 安装全攻略:从入门到上手
  • 螺杆支撑座在运用中会出现哪些问题?
  • Java与SQL Server数据库连接的实践与要点
  • 客户案例:基于慧集通的致远OA与海康威视智能会议设备集成方案
  • 嵌入式驱动开发详解7(并发、竞争、中断)
  • @repository注解
  • Linux top指令
  • Anaconda 安装与虚拟环境创建完整指南
  • 基于自然语言处理(NLP)的智能客服系统
  • C语言期末复习题(PTA)
  • Ubuntu 中安装 RabbitMQ 教程
  • 如何测试模型推理精度:Python初学者指南
  • 人工智能与区块链的碰撞:双剑合璧的创新前景