当前位置: 首页 > news >正文

Vitis HLS 学习笔记--控制驱动与数据驱动混合编程

目录

1. 简介

2. 示例分析

2.1 代码分析

2.2 控制驱动TLP的关键特征

2.3 数据驱动TLP的关键特征

3. 总结


1. 简介

在 HLS 硬件加速领域,Vitis HLS 提供了强大的抽象并行编程模型。这些模型包括控制驱动和数据驱动的任务级并行性(TLP),它们是硬件设计优化的基石。控制驱动TLP通过#pragma HLS dataflow指令实现函数的并行执行,而数据驱动TLP则利用hls::task类将函数转化为并行任务。这篇博文将深入探讨这两种并行性的特点,并通过代码示例展示它们在实际硬件设计中的应用,揭示如何有效地结合这两种模型以提升硬件性能和加速复杂算法的执行。

2. 示例分析

2.1 代码分析

#include "hls_np_channel.h"
#include "hls_task.h"void worker(hls::stream<int>& in, hls::stream<int>& out) {int i = in.read();int o = i * 2 + 1;out.write(o);
}void read_in(int* in, int n, hls::stream<int>& out) {for (int i = 0; i < n; i++) {out.write(in[i]);}
}void write_out(hls::stream<int>& in, int* out, int n) {for (int i = 0; i < n; i++) {out[i] = in.read();}
}void dut(int in[16], int out[16], int n) {hls_thread_local hls::split::round_robin<int, 4> split1;hls_thread_local hls::merge::round_robin<int, 4> merge1;
#pragma HLS dataflowread_in(in, n, split1.in);// Task-Channelshls_thread_local hls::task t[4];for (int i = 0; i < 4; i++) {
#pragma HLS unrollt[i](worker, split1.out[i], merge1.in[i]);}write_out(merge1.out, out, n);
}

功能分析:

  • worker:从输入流中读取数据,进行处理(乘2加1),然后将结果写入输出流。
  • read_in:从输入数组中读取数据,写入到输出流。
  • write_out:从输入流中读取数据,写入到输出数组。

2.2 控制驱动TLP的关键特征

#pragma HLS dataflow 指示HLS工具启用数据流模式,让不同的函数可以并行执行,它是控制驱动TLP的关键特征,具体体现如下:

  • read_in 函数和 split1 模块将数据分发到不同的通道。
  • 四个 worker 函数并行处理数据。
  • write_out 函数和 merge1 模块从不同的通道收集数据并写入输出数组。

此外,顶层函数 void dut(int in[16], int out[16], int n)  中,参数 in 和 out 均为外部存储器。

2.3 数据驱动TLP的关键特征

hls::task是一个任务通道,它允许将函数作为任务并行执行,它是数据驱动TLP的关键特征

示例代码中,worker函数被封装成任务并分配给四个hls::task实例,每个实例处理输入数据流的一部分,并将结果发送到合并通道。

hls::split::round_robin和hls::merge::round_robin是用于数据分割和合并的工具,它们支持数据流中的并行处理。split1将输入数据流平均分配给四个工作任务,而merge1则将这些任务的输出合并回单个数据流。

#pragma HLS unroll指令用于完全展开循环,确保所有任务并行执行。

3. 总结

在Vitis HLS中,控制驱动(Control-driven)和数据驱动(Data-driven)的并行性是高效硬件设计的两个关键组成部分。控制驱动并行性通过#pragma HLS dataflow指令实现,允许不同函数在数据准备好时即刻并行执行,从而优化整体性能。数据驱动并行性则通过hls::task类实现,它将函数封装为可并行执行的任务。这两种技术的结合,使得设计者能够充分利用硬件资源,实现复杂算法的高效执行。通过示例代码的分析,我们可以看到如何在实践中应用这些并行编程模型,以及它们如何协同工作以达到最佳的硬件加速效果。

http://www.lryc.cn/news/364060.html

相关文章:

  • VUE3 学习笔记(12):对比Vuex与Pinia状态管理的基本理解
  • 区间预测 | Matlab实现QRCNN-BiGRU-Attention分位数回归卷积双向门控循环单元注意力机制时序区间预测
  • TypeScript算法每日一题:赎金信(383)
  • springboot 作为客户端接收服务端的 tcp 长连接数据,并实现自定义结束符,解决 粘包 半包 问题
  • kuka编程怎么加中文:解锁KUKA机器人编程中的中文支持
  • hadoop集群中zookeeper的搭建与原理解释
  • HTML静态网页成品作业(HTML+CSS)—— 父亲节节日介绍网页(4个页面)
  • Client ID 与Client Secret
  • React中实现大模型的打字机效果
  • 十二、配置注解执行SQL
  • 阿里云计算之运维概念学习笔记(一)
  • 异常概述
  • 【Postman接口测试】第五节.Postman接口测试项目实战(下)
  • 医用腕带朔源用的条形码与二维码如何选择
  • “Kubectl 如何工作案例:编写自定义 Kubectl 命令
  • opencv-python(五)
  • 免费生物蛋白质的类chatgpt工具助手copilot:小分子、蛋白的折叠、对接等
  • Mybatis01-初识Mybatis
  • 算法课程笔记——基础数据结构 堆
  • 边缘数据采集网关为企业提供高效、安全、可靠的数据采集解决方案-天拓四方
  • 鸿蒙开发接口安全:【@ohos.security.huks (通用密钥库系统)】
  • 黄仁勋:打破摩尔定律,机器人时代来了
  • 每天的CTF小练--6.5(ascll码高级运用)
  • docker参数大P与小p的区别
  • 智慧启航 网联无限丨2024高通汽车技术与合作峰会美格智能分论坛隆重举行
  • 20.Redis之缓存
  • vue中实现一个时间选择器的级联框,第一层小时,第二层分钟
  • 数据分析必备:一步步教你如何用Pandas做数据分析(17)
  • 检查用户是否在错误的目录中运行了CMake命令
  • 前端工程化工具系列(四)—— Commitlint(v19.3.0):规范化 Git 提交