当前位置: 首页 > news >正文

本地多模态看图说话-llava

其中图片为bast64转码,方便json序列化。

其中模型llava为本地ollama运行的模型,如:ollama run llava

还有其它的模型如:llava-phi3,通过phi3微调过的版本。

实际测试下来,发现本地多模型的性能不佳,不佳也是肯定的,多模态图片评分本身也不高啊。

http://www.lryc.cn/news/402853.html

相关文章:

  • 人工智能算法工程师(中级)课程14-神经网络的优化与设计之拟合问题及优化与代码详解
  • Java异常抛出与处理方法
  • 兼容性测试主要有什么类型?
  • 设计模式--组合模式
  • ArduPilot开源代码之AP_DAL_RangeFinder
  • SpringCloud教程 | 第九篇: 使用API Gateway
  • 数据结构——hash(hashmap源码探究)
  • 国产麒麟、UOS在线打开pdf加盖印章
  • 破解反爬虫策略 /_guard/auto.js(二)实战
  • 同样是人工智能 客户在哪儿AI和GPT等大模型有什么不同
  • AES Android IOS H5 加密方案
  • 一文了解变阻器和电位器的定义、原理、应用及其对比
  • WPF实现一个带旋转动画的菜单栏
  • 使用Dockerfile构建镜像
  • 概率论原理精解【3】
  • [C/C++入门][循环]14、计算2的幂(2的n次方)
  • RPC与服务的注册发现
  • 3112. 访问消失节点的最少时间 Medium
  • FastAPI 学习之路(五十二)WebSockets(八)接受/发送json格式消息
  • Go语言并发编程-案例_3
  • pikachu之跨站脚本攻击(x‘s‘s)
  • Qt模型/视图架构——委托(delegate)
  • python3.11SSL: SSLV3_ALERT_HANDSHAKE_FAILURE
  • [深度学习]基于yolov10+streamlit目标检测演示系统设计
  • 开源模型应用落地-FastAPI-助力模型交互-进阶篇(三)
  • 机器人及其相关工科专业课程体系
  • C#数字医学影像系统(RIS/PACS)源码,Oracle数据库,C/S架构,运行稳定
  • Spring-Boot基础--yaml
  • C/C++蓝屏整人代码
  • 【Android安全】Ubuntu 下载、编译 、刷入Android-8.1.0_r1