当前位置: 首页 > news >正文

HLS 后端示例

更多 TVM 中文文档可访问 →Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。 | Apache TVM 中文站


TVM 支持带有 SDAccel 的 Xilinx FPGA 板,接下来介绍如何将 TVM 部署到 AWS F1 FPGA 实例。

备注:此功能仍处于测试阶段,目前无法用 SDAccel 部署端到端神经网络。
本教程使用了两个 Python 脚本:

  • build.py - 用于合成 FPGA 比特流的脚本。
import tvmfrom tvm import tetgt= tvm.target.Target("sdaccel", host="llvm")n = te.var("n")A = te.placeholder((n,), name='A')B = te.placeholder((n,), name='B')C = te.compute(A.shape, lambda i: A[i] + B[i], name="C")s = te.create_schedule(C.op)px, x = s[C].split(C.op.axis[0], nparts=1)s[C].bind(px, tvm.te.thread_axis("pipeline"))fadd = tvm.build(s, [A, B, C], tgt, name="myadd")fadd.save("myadd.o")fadd.imported_modules[0].save("myadd.xclbin")tvm.contrib.cc.create_shared("myadd.so", ["myadd.o"])
  • run.py - 将 FPGA 作为加速器的脚本。
import tvmimport numpy as npimport ostgt = "sdaccel"fadd = tvm.runtime.load_module("myadd.so")if os.environ.get("XCL_EMULATION_MODE"):fadd_dev = tvm.runtime.load_module("myadd.xclbin")else:fadd_dev = tvm.runtime.load_module("myadd.awsxclbin")fadd.import_module(fadd_dev)dev = tvm.device(tgt, 0)n = 1024a = tvm.nd.array(np.random.uniform(size=n).astype("float32"), dev)b = tvm.nd.array(np.random.uniform(size=n).astype("float32"), dev)c = tvm.nd.array(np.zeros(n, dtype="float32"), dev)fadd(a, b, c)tvm.testing.assert_allclose(c.numpy(), a.numpy() + b.numpy())

设置

  • 用 FPGA Developer AMI 启动实例。无需 F1 实例来进行仿真和合成,因此推荐用开销较低的实例。
  • 设置 AWS FPGA 开发套件:
git clone https://github.com/aws/aws-fpga.gitcd aws-fpgasource sdaccel_setup.shsource ${XILINX_SDX}/settings64.sh
  • 启用 OpenCL 前设置 TVM。

仿真​

  • 为仿真创建 emconfig.json:
emconfigutil --platform ${AWS_PLATFORM} --nd 1
  • 将 emconfig.json 复制到 Python binary 目录下:因为当前的 Xilinx 工具包假定宿主机的二进制文件和 emconfig.json 文件处于同一路径。
cp emconfig.json $(dirname $(which python))
  • 运行软件仿真:
export XCL_EMULATION_MODE=1export XCL_TARGET=sw_emupython build.pypython run.py
  • 运行硬件仿真:
export XCL_EMULATION_MODE=1export XCL_TARGET=hw_emupython build.pypython run.py

合成​

  • 用以下脚本进行合成:
unset XCL_EMULATION_MODEexport XCL_TARGET=hwpython build.py
  • 创建 AWS FPGA 镜像,并将其上传到 AWS S3:
${SDACCEL_DIR}/tools/create_sdaccel_afi.sh \-xclbin=myadd.xclbin -o=myadd \-s3_bucket=<bucket-name> -s3_dcp_key=<dcp-folder-name> \-s3_logs_key=<logs-folder-name>

这会生成 awsxclbin 文件(在 F1 实例上使用 AWS FPGA 镜像必需)。

运行​

  • 启动 Amazon EC2 F1 实例。
  • 将 myadd.so,myadd.awsxclbin 和 run.py 复制到 F1 实例中。
  • 设置 AWS FPGA 开发套件:
git clone https://github.com/aws/aws-fpga.gitcd aws-fpgasource sdaccel_setup.sh
  • 启用 OpenCL 前设置 TVM。
  • 以 root 身份设置环境变量:
sudo shsource ${INSTALL_ROOT}/setup.sh
  • 运行:
python run.py
http://www.lryc.cn/news/148812.html

相关文章:

  • 实录分享 | Alluxio在AI/ML场景下的应用
  • Streamlit 讲解专栏(十二):数据可视化-图表绘制详解(下)
  • Dockerfile 使用教程
  • InnoDB的Buffer
  • 普洛斯常熟东南数据中心获LEED金级认证及IDCC绿色算力基础设施奖
  • RabbitMQ 启动及参数说明
  • Vite打包性能优化及填坑
  • JDBC使用了哪种设计模式
  • JVM-性能优化工具 MAT
  • Python Flask flasgger api文档[python/flask/flasgger]
  • k8s常见命令
  • Unity3d C#实现调取网络时间限制程序的体验时长的功能
  • 常静相伴:深度解析C++中的const与static关键字
  • Linux入门之进程信号|信号产生的方式
  • Unity中的数学基础——贝塞尔曲线
  • 大数据平台安全主要是指什么安全?如何保障?
  • Flutter的未来与趋势,23年还学吗?
  • RHCE——十三、Shell自动化运维编程基础
  • 深入理解AMBA总线协议(AXI总结篇)
  • 建立无需build的react单页面应用SPA框架(2)
  • C# char曲线控件
  • 远程访问本地jupyter notebook服务 - 无公网IP端口映射
  • flume系列之:记录一次消费大量Debezium数据,数据包含dml语句比较大,造成数据堆积在channel的解决方法
  • Could not find artifact com.pageOffice:pageOffice:pom:4.3.0.2 in aliyunmaven
  • 2023年9月数据治理/项目管理/产品管理/商务礼仪企业内训定制
  • 后端面试话术集锦第 九 篇:Activiti工作流面试话术
  • JS中方法、函数、属性是一个东西吗
  • 面经:微服务
  • K8s 持久化存储有几种方式?一文了解本地盘/CSI 外接存储/K8s 原生存储的优缺点
  • 【MySQL】3、MySQL的索引、事务、存储引擎