当前位置: 首页 > news >正文

【个人开源】——从零开始在高通手机上部署sd(二)

代码:https://github.com/chenjun2hao/qualcomm.ai

请添加图片描述
请添加图片描述

推理耗时统计

单位/ms

硬件qnncpu_clipqnncpu_unetqnncpu_vaehtp_cliphtp_unethtp_vae
骁龙8 gen1+24716.994133440.39723.215411.097696.327

1. 下载依赖

  • 下载opencv_x64.tar,提取码: rrbp
  • 下载opencv_aarch64.tar, 提取码: xj8w
    修改CMakeLists.txtOPENCV_X64_PATHOPENCV_AARCH64_PATH的路径
  • 安装高通QNN,并声明QNN_SDK_ROOT环境变量
  • 下载android_ndk, 我使用的版本android-ndk-r26c

2. 编译

1.linux

mkdir build_x64 && cd build_x64
cmake .. -DCMAKE_BUILD_TYPE=Debug
make -j8

2.android

mkdir build_android && cd build_android
cmake -DCMAKE_TOOLCHAIN_FILE=$ANDROID_NDK_ROOT/build/cmake/android.toolchain.cmake \-DANDROID_ABI="arm64-v8a" \-DANDROID_NDK=$ANDROID_NDK_ROOT \-DANDROID_PLATFORM=android-28 \-DPLATFORM_X64=OFF \..
make -j8

3. x64 cpu执行浮点模型

  1. 转换浮点模型
    参考qualcomm.sd, readme导出浮点模型

  2. 执行

export FLOAT_MODEL_PATH=/data1/chenjun/2_qualcomm_ai/sd2.1			# 修改成自己导出模型的路径
./build_x64/example/sd2.1/sd_15.out \${QNN_SDK_ROOT}/lib/x86_64-linux-clang/libQnnCpu.so \${QNN_SDK_ROOT}/lib/x86_64-linux-clang/libQnnHtp.so \${FLOAT_MODEL_PATH}/qnn_models/text_encoder_float/x86_64-linux-clang/libtext_encoder.so \${FLOAT_MODEL_PATH}/qnn_models/unet_float/x86_64-linux-clang/libunet.so \${FLOAT_MODEL_PATH}/qnn_models/vae_decoder_float/x86_64-linux-clang/libvae_decoder.so \10

可视化output/sd21_portrait.jpg(种子未固定,结果具有随机性):

diffusers pipe结果

4. 高通HTP执行量化模型

  1. 转换浮点模型
    参考qualcomm.sd, readme导出量化模型

  2. 执行
    参考高通的例子,我自己的adb操作,将所有的依赖push到手机再跑模型

export LD_LIBRARY_PATH=$PWD
# 跑sd
./sd_15_htp.out ./libQnnCpu.so ./libQnnHtp.so ./model_quant/libtext_encoder.so ./model_float/libunet.so ./model_float/libvae_decoder.so 10

结果保存在output/sd21_portrait_quant.jpg, 再adb pull下来看

其他

  1. qnn输入输出dataformat都是NHWC
  2. qnn 2.14.0.230828 cpu不支持量化的模型推理,需要用htp的后端
  3. qnn 2.26.0.240827 cpu也不支持量化模型的推理,composeGraphs的时候报错
http://www.lryc.cn/news/541086.html

相关文章:

  • 【MCU驱动开发概述】
  • PC端Linux之虚拟CAN
  • C++:std::thread、条件变量与信号量
  • POI pptx转图片
  • Java File 类
  • 工业通信协议 EtherNet/IP 全面解析
  • 使用docker配置PostgreSQL
  • UITextView删除原有字符串时,光标会上移并且光标会变高
  • python入门 介绍及变量的使用
  • 51单片机-按键
  • Java 8 至 Java 23 版本特性对比表
  • 在wsl环境中配置和开发verilog(一种比较新颖的verilog开发指南)
  • AI学习指南HuggingFace篇-Hugging Face 的核心工具
  • DeepSeek 助力 Vue 开发:打造丝滑的二维码生成(QR Code)
  • QT 引入Quazip和Zlib源码工程到项目中,无需编译成库,跨平台,压缩进度
  • 深入解析桥接模式:软件设计中的解耦利器
  • MYSQL-数据库-DDL-DML-DQL-DCL-基础学习
  • rv1126解码的一些原理
  • 二级公共基础之数据结构与算法篇(七)排序技术
  • 深蕾科技智能多媒体SoC产品助力“DataEye剧查查之夜”微短剧盛会
  • Apache Doris 实现毫秒级查询响应
  • 计算机考研之数据结构:P 问题和 NP 问题
  • 新数据结构(13)——I/O
  • PySide6学习专栏(四):用多线程完成复杂计算任务
  • Python多线程编程理解面试题解析
  • Flutter - 初体验
  • 使用最广泛的Web应用架构
  • YOLOv11-ultralytics-8.3.67部分代码阅读笔记-split_dota.py
  • Unity shader glsl着色器特效之 模拟海面海浪效果
  • `AdminAdminDTO` 和 `userSession` 对象中的字段对应起来的表格