当前位置：首页 > news >正文

AIxBoard部署BLIP模型进行图文问答

news 2025/7/26 21:35:58

一、AIxBoard简介

AIxBoard（X板）是一款IA架构的人工智能嵌入式开发板，体积小巧功能强大，可让您在图像分类、目标检测、分割和语音处理等应用中并行运行多个神经网络。它是一款面向专业创客、开发者的功能强大的小型计算机，借助OpenVINO工具套件，CPU、iGPU都具备强劲的AI推理能力，基于 AI 的产品进行原型设计并将其快速推向市场的理想解决方案。

二、多模态模型简介

近年来，计算机视觉和自然语言处理领域各自都取得了飞速发展。但许多实际问题本质上其实是多模态的，即它们同时涉及几种不同形式的数据，如图像和文本。因此，需要视觉语言模型来帮助解决一系列组合模态的挑战，我们的技术才能最终得到广泛落地。视觉语言模型可以处理的一些图生文任务包括图像字幕生成、图文检索以及视觉问答。图像字幕生成可以用于视障人士辅助、创建有用的产品描述、识别非文本模态的不当内容等。图文检索可以用于多模态搜索，也可用于自动驾驶场合。视觉问答可以助力教育行业、使能多模态聊天机器人，还可用于各种特定领域的信息检索应用。

目前常用的SOTA多模态语言模型有BLIP、BLIP2、LLAVA等。

三、部署openvino_notebooks中视觉问答demo

本文拟选取BLIP模型在AIxBoard上部署，实现一个视觉问答的功能demo，其余更先进的BLIP2、LLAVA、GPT-4V待下次有空来研究。

下载官方的demo，并启动jupyter-lab notebooks

git clone https://github.com/openvinotoolkit/openvino_notebooks.gitcd .\openvino_notebooks\notebooksjupyter-lab notebooks

仔细阅读blip-visual-language-processing.ipynb文档里面的内容，逐次执行

得到结果输出：

实验完成，可以切换尝试其他图片

AIxBoard爱克斯板
使用 BLIP-2 零样本“图生文”

查看全文

http://www.lryc.cn/news/421598.html

小白零基础学数学建模应用系列(一）：探索自由下落模型——以“坠落的硬币”为例

linux主机间免密登录

【海思SS626 | VB】关于视频缓存池的理解

RCE漏洞及绕过

非对称加密算法-ECDHE

10分钟学会Docker的安装和使用

江科大/江协科技 STM32学习笔记P20

CSS 实现两边固定宽，中间自适应

C#图片批量下载Demo

部署Springboot + Vue 项目到远程服务器Windows10系统的详细配置

智驭灌区，科技领航—— 高效灌区信息化系统管理平台

下载免费设计素材，有这7个网站就够了

【漏洞复现】某赛通数据泄露防护(DLP)系统 NetSecConfigAjax SQL注入漏洞

c++中的仿函数

springboot整合mybatis-plus和pagehelper插件报错，

趋动科技荣登「AIGC赋能金融创新引领者TOP20」

SOPHGO算能科技BM1684盒子占用空间满的问题解决

Spring Boot实用小技巧 - - 第523篇

安卓App开发篇二：Android UI和布局

【NLP】文本特征处理：n-gram特征和文本长度规范

ESP32人脸识别开发 ---partitions.csv配置的一些说明（五）

【学习笔记】Matlab和python双语言的学习(图论最短路径）

vue.config.js 配置 devserve 配置

不入耳耳机什么牌子性价比高？五大年度必选款揭秘

一、AIxBoard简介

二、多模态模型简介

三、部署openvino_notebooks中视觉问答demo

相关文章：