当前位置: 首页 > news >正文

Go使用SIMD指令——以string转为整数为例

本文Go使用SIMD指令采用如下方式:

  1. C编写对应的程序
  2. clang编译成汇编
  3. c2goasm将上述生成的汇编转为go的汇编

准备工具

  1. clang。直接使用apt-get install clang安装即可
  2. c2goasm。 go get -u github.com/minio/c2goasm来进行安装
  3. asm2plan9s。 go get -u github.com/minio/asm2plan9s
  4. yasm。直接使用功能apt-get install yasm,asm2plan9s依赖的工具

示例

// simd.c
#include <immintrin.h>
#include <stdint.h>void simd_str_to_int(const char *str, size_t len,  uint64_t* result) {__m128i ten = _mm_set1_epi8('0');__m128i mult=_mm_set_epi8(1,10,1,10,1,10,1,10,1,10,1,10,1,10,1,10);__m128i data = _mm_loadu_si128((__m128i const *)(str));data=_mm_sub_epi8(data, ten);data=_mm_maddubs_epi16(data, mult);mult=_mm_set_epi16(1,100,1,100,1,100,1,100);data=_mm_madd_epi16(data,mult);int32_t da[4];_mm_storeu_si128((__m128i *)da, data);*result= da[0]*1000000000000l+da[1]*100000000l+da[2]*10000+da[3];
}

采用如下命令

clang -S -DENABLE_AVX2 -target x86_64-unknown-none -masm=intel -mno-red-zone -mstackrealign -mllvm -inline-threshold=1000 -fno-asynchronous-unwind-tables -fno-exceptions -fno-rtti -O3 -fno-builtin -ffast-math -mavx simd.c -o simd.s 

准备文件simd_amd64.go

//go:build !noasm && !appengine
// +build !noasm,!appenginepackage mainimport ("reflect""unsafe"
)//go:noescape
func _simd_str_to_int(src unsafe.Pointer, size int64, result unsafe.Pointer)func SIMDToInt(va string) uint64 {h := (*reflect.StringHeader)(unsafe.Pointer(&va))var result uint64_simd_str_to_int(unsafe.Pointer(h.Data), int64(len(va)), unsafe.Pointer(&result))return result
}

clang导出的函数符号是以下划线开头,即_simd_str_to_int

开始导出go汇编

c2goasm -a simd.s simd_amd64.s

注意输出文件的名必须和对应声明go文件的名一致。即都为simd_amd64

参考文献

通过c生成的汇编,生成可供go执行的汇编

http://www.lryc.cn/news/473134.html

相关文章:

  • 分享资源合集
  • C#/WinForm 鼠标穿透自定义区域截图(后续实现录屏)
  • 基于SpringBoot的“社区维修平台”的设计与实现(源码+数据库+文档+PPT)
  • 图书管理系统汇报
  • 【发版通知】FormMaking 表单设计器新版发布,赋能企业实现低代码开发!
  • 计算机科学与技术-毕业设计选题推荐
  • 《C++音频频谱分析:开启声音世界的神秘之门》
  • GitHub 上传项目保姆级教程
  • 联想笔记本电脑睡眠后打开黑屏解决方法
  • 计算机网络:网络层 —— 路由选择与静态路由配置
  • [LeetCode-55]基于贪心算法的跳跃游戏的求解(C语言版)
  • C# 将批量图片转为PDF文件
  • 大模型面试题63题(1-11)
  • 【Flask】二、Flask 路由机制
  • Java项目实战II基于Spring Boot的交通管理在线服务系统设计与实现(开发文档+数据库+源码)
  • 【PythonWeb开发】Flask-RESTful视图类基础知识
  • Kubernetes——part10-2 kubernetes 日志收集方案 EFK
  • mockito+junit完成单元测试
  • 基于web的便捷饭店点餐小程序的设计与实现(lw+演示+源码+运行)
  • CUDA环境安装终极指南——Linux(其它系统也一样)
  • 安卓开发之登录页面(跳转版)
  • solidworks学习6吊环-20241030
  • 数据结构和算法-动态规划(3)-经典问题
  • Java算法-一维前缀和与差分
  • Elasticsearch 安装教程:驾驭数据海洋的星际导航仪
  • 【解决方案】微信小程序如何使用 ProtoBuf 进行 WebSocket 通信
  • 独立游戏开发者面临的挑战与困境
  • KVM 虚拟机Anolis OS 8.9 下利用宝塔面板中的 Docker 配置 Nextcloud + onlyoffice
  • 串口扫盲TTL,TX/TR/GND
  • Python酷库之旅-第三方库Pandas(181)