当前位置: 首页 > news >正文

VLM多模态图像识别小模型UForm

参考:https://github.com/unum-cloud/uform
https://huggingface.co/unum-cloud/uform-gen2-qwen-500m

https://baijiahao.baidu.com/s?id=1787054120353641459&wfr=spider&for=pc

demo:https://huggingface.co/spaces/unum-cloud/uform-gen2-qwen-500m-demo
在这里插入图片描述

UForm相比其他多模态模型小很多,不到5G参数

UForm-Gen is a small generative vision-language model primarily designed for Image Captioning and Visual Question Answering. The model consists of two parts:CLIP-like ViT-H/14
Qwen1
http://www.lryc.cn/news/302546.html

相关文章:

  • 我的NPI项目之设备系统启动(七) -- 高通OS启动阶段和镜像分区简析
  • vue框架-vue-cli
  • Sora (text-to-video model-文本转视频模型)
  • java生态环境评价Myeclipse开发mysql数据库web结构java编程计算机网页项目
  • 数据结构-最短路径(Dijkstra算法与Floyd算法)
  • 文献速递:GAN医学影像合成--联邦生成对抗网络基础医学图像合成中的后门攻击与防御
  • Java实现自动化pdf打水印小项目 使用技术pdfbox、Documents4j
  • hive load data未正确读取到日期
  • C++ 遍历map的3中方法
  • redis 主从模式,sentinel 模式配置
  • 小型医院医疗设备管理系统|基于springboot小型医院医疗设备管理系统设计与实现(源码+数据库+文档)
  • CSS学习(三)
  • CentOS7安装InfluxDB2简易教程
  • 数据库:信息存储与管理的关键
  • 极智芯 | 解读NVIDIA RTX5090 又是一波被禁售的节奏
  • rtt的io设备框架面向对象学习-硬件rtc设备
  • 产品经理学习-产品运营《流程管理》
  • 压缩感知——革新数据采集的科学魔法
  • 华为配置直连三层组网直接转发示例
  • MCAL知识点(二十八):TC275如何通过EB-Tresos配置实现硬件触发ADC同步采样(电机控制器三相电流同步采样)
  • proteus8.15图文安装教程
  • ACP科普:敏捷开发之kanban
  • 代理模式(Proxy模式)
  • Android使用shape定义带渐变色的背景
  • 轻松搞定Makefile
  • 【C++之类和对象篇002】
  • k8s学习(RKE+k8s+rancher2.x)成长系列之简配版环境搭建(三)
  • 基于SSM的疫情期间学生信息管理平台的设计与实现(有报告)。Javaee项目。ssm项目。
  • LeetCode_20_简单_有效的括号
  • gRPC 备查