当前位置: 首页 > news >正文

使用Triton部署ONNX模型

介绍

适用于各种 AI 工作负载的推理:借助 NVIDIA Triton™,在任何处理器(GPU、CPU 或其他)上,对使用基于任何框架的,经过训练的机器学习模型或深度学习模型,进行推理部署。Triton 是 NVIDIA AI 平台的一部分,可通过 NVIDIA AI Enterprise 获取。这款开源软件可针对各种工作负载,实现标准化的 AI 模型部署和执行。

优势

支持所有训练和推理框架:使用 Triton,部署基于任何主流框架的 AI 模型,包括 TensorFlow,PyTorch,Python,ONNX,NVIDIA® TensorRT™、RAPIDS™ cuML,XGBoost,scikit-learn RandomForest,OpenVINO,C++ 自定义框架等。

可在任何平台上实现高性能推理:借助动态批处理、并发执行、最佳模型配置,音视频串流输入支持,最大限度地提升吞吐量和资源利用率。Triton 支持所有 NVIDIA GPU,x86 和 Arm® 架构 CPU 以及 AWS Inferentia。

专为 DevOps 和 MLOps 设计的开源软件:可将 Triton 集成到 DevOps 和 MLOps 解决方案中,例如集成到 Kubernetes 实现规模化,或集成到 Prometheus 进行监测。Triton 也可以通过所有主流云平台、本地 AI 平台和 MLOps 平台获取。

企业级安全性、可管理性和 API 稳定性:NVIDIA AI Enterprise(包括 NVIDIA Triton 和 Triton Management Service),是一个安全的、生产就绪型的 AI 软件平台,提供支持、安全性和 API 稳定性,帮助企业加速开发 AI,实现收益。

镜像介绍

在这里插入图片描述

部署ONNX模型

在这里插入图片描述
将onnx模型按照 base_path /model_name / version / model.onnx 的模式放入指定文件夹中,onnx模型可以不指定config.pbtxt。

在nvidia-Triton官方文档中根据CUDA和Ubuntu版本选择合适的镜像,CUDA版本需要不大于系统安装的CUDA版本。

运行指令创建Triton推理容器

$ docker run --gpus=1 --rm -p8000:8000 -p8001:8001 -p8002:8002 -v/full/path/to/docs/examples/model_repository:/models nvcr.io/nvidia/tritonserver:<xx.yy>-py3 tritonserver --model-repository=/models
http://www.lryc.cn/news/272008.html

相关文章:

  • Python访问ElasticSearch
  • Flutter 混合开发 - 动态下发 libflutter.so libapp.so
  • Peter算法小课堂—动态规划
  • 2022–2023学年2021级计算机科学与技术专业数据库原理 (A)卷
  • Clojure 实战(4):编写 Hadoop MapReduce 脚本
  • Django 分页(表单)
  • socket实现视频通话-WebRTC
  • simulink代码生成(九)—— 串口显示数据(纸飞机联合调试)
  • Mysql数据库(中)——增删改查的学习(全面,详细)
  • test dbtest-03-对比 Liquibase、flyway、dbDeploy、dbsetup
  • 力导向图与矩阵排序
  • word 常用功能记录
  • C#线程基础(线程启动和停止)
  • 如何利用ChatGPT来提高编程效率
  • java智慧工地源码,互联网+建筑工地,实现对工程项目内人员、车辆、安全、设备、材料等的智能化管理
  • 创建并使用自己的C++模块(Windows10+MSVC)
  • Spring Boot 2.7.11 集成 GraphQL
  • 软件工程期末总结
  • MidTool图文创作-GPT-4与DALL·E 3的结合
  • Python将两个或多个列表合并为一个列表,并根据每个输入列表中的元素的位置将其组合在一起
  • 数模混合SoC芯片中LEF2Milkyway的golden flow
  • Five tips to make your essay flow
  • linux驱动(二):led补
  • 性能测试-jmeter:安装 / 基础使用
  • 数据仓库-数仓优化小厂实践
  • uniapp中uview组件丰富的Code 验证码输入框的使用方法
  • md文件图片上传方案:Github+PicGo 搭建图床
  • 从零开始 - 在Python中构建和训练生成对抗网络(GAN)模型
  • OfficeWeb365 Indexs 任意文件读取漏洞复现
  • Crypto的简单应用-前后端加密传输