当前位置: 首页 > news >正文

vLLM代码推理Qwen2-VL多模态

由于近期代码微调以及测试都是在远程服务器上,因此LLamafactory-cli webui 以及vLLM的ui均无法使用,因此不断寻求解决方案,我提供一个解决方案,LLamafactory微调完成的模型需要合并为一个完整模型后再使用vLLM进行代码推理测试微调模型的结果。

由于chat启动的终端互动模式均无法上传图像进行交互,因此需要代码或者参数来上传图像进行理解。

Vision Language — vLLM

 这个链接里有vLLM支持的多模态大模型不同的函数对prompt的处理

我在这里提供一个使用vLLM对Qwen2-VL的多模态图像理解的python代码

from vllm import LLM, SamplingParams
from PIL import Imagedef run_qwen2_vl(questions: str, image_path: str):# 模型初始化配置llm = LLM(model="Qwen/Qwen2-VL-Lora_Sft",max_model_len=4096,max_num_seqs=5,dtype="half")# 多模态数据加载image = Image.open(image_path)question = "What is the content of this image?"# 提示词构造prompt_template = [("<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n""<|im_start|>user\n<|vision_start|><|image_pad|><|vision_end|>"f"{question}<|im_end|>\n""<|im_start|>assistant\n") for question in questions]print(prompt_template[0])sampling_params = SamplingParams(max_tokens=1024,temperature=0.8,top_p=0.95,frequency_penalty=0.2,presence_penalty=0.3,stop=["<|im_end|>"])# 生成请求outputs = llm.generate({"prompt": prompt_template[0],"multi_modal_data": {"image": image},}, sampling_params=sampling_params)# 结果解析return [output.outputs[0].text for output in outputs]# 使用示例
if __name__ == "__main__":response = run_qwen2_vl(questions=["请使用中文描述下这个图像并给出中文诊断结果"],image_path="aaaa.jpg")print("模型输出:", response[0])

http://www.lryc.cn/news/547037.html

相关文章:

  • DNS云解析有什么独特之处?
  • 视频流畅播放相关因素
  • Python实现一个类似MybatisPlus的简易SQL注解
  • linux一些使用技巧
  • 小模型和小数据可以实现AGI吗
  • io学习----->文件io
  • kubernetes介绍
  • 如何高效准备PostgreSQL认证考试?
  • 如何使用Briefing打造私有视频会议系统结合内网穿透异地远程连接
  • XHR请求解密:抓取动态生成数据的方法
  • 坐标变换介绍与机器人九点标定的原理
  • 串口调试助手Alien v5.198新版发布
  • 解锁Android RemoteViews:跨进程UI更新的奥秘
  • 编译可以在Android手机上运行的ffmpeg程序
  • Verilog学习方法—基础入门篇(一)
  • 本地jar包添加到 maven
  • C# Unity 唐老狮 No.6 模拟面试题
  • 项目工坊 | Python驱动淘宝信息爬虫
  • Java8-Stream流介绍和使用案例
  • setlocale()的参数,“zh_CN.UTF-8“, “chs“, “chinese-simplified“的差异。
  • docker 安装达梦数据库(离线)
  • FastGPT 引申:如何基于 LLM 判断知识库的好坏
  • 关于2023新版PyCharm的使用
  • Leetcode 112: 路径总和
  • 华为云IAM 用户名和IAM ID
  • Compose Multiplatform+Kotlin Multiplatfrom 第四弹跨平台
  • 【Proteus仿真】【STM32单片机】全自动养护智能生态雨林缸
  • GBT32960 协议编解码器的设计与实现
  • SolidWorks 转 PDF3D 技术详解
  • OpenMCU(二):GD32E23xx FreeRTOS移植