当前位置: 首页 > news >正文

联想Y7000+RTX4060+i7+Ubuntu22.04运行DeepSeek开源多模态大模型Janus-Pro-1B+本地部署

直接上手搓了:

conda create -n myenv python=3.10 -ygit clone https://github.com/deepseek-ai/Janus.gitcd Januspip install -e .pip install webencodings beautifulsoup4 tinycss2pip install -e .[gradio]pip install 'pexpect>4.3'python demo/app_januspro.py

由于RTX4060只有8G显存,只能运行1B的模型,下面是下载模型的代码:

from modelscope import snapshot_download, AutoTokenizer
from transformers import TrainingArguments, Trainer, DataCollatorForSeq2Seq, Qwen2VLForConditionalGeneration, AutoProcessor
import torch# 在modelscope上下载Qwen2-VL模型到本地目录下
model_dir = snapshot_download("deepseek-ai/Janus-Pro-1B", cache_dir="./", revision="master")# 使用Transformers加载模型权重
tokenizer = AutoTokenizer.from_pretrained("./deepseek-ai/Janus-Pro-1B/", use_fast=False, trust_remote_code=True)
# 特别的,Qwen2-VL-2B-Instruct模型需要使用Qwen2VLForConditionalGeneration来加载
model = Qwen2VLForConditionalGeneration.from_pretrained("./deepseek-ai/Janus-Pro-1B/", device_map="auto", torch_dtype=torch.bfloat16, trust_remote_code=True,)
model.enable_input_require_grads()  # 开启梯度检查点时,要执行该方法

修改demo/app_januspro.py中model的名称为1B。运行后用浏览器打开http://127.0.0.1:7860即可。

使用效果图:

http://www.lryc.cn/news/530158.html

相关文章:

  • [Spring] Gateway详解
  • 音叉模态分析
  • BW AO/工作簿权限配置
  • C++ 字母大小写转换两种方法统计数字字符的个数
  • 如何使用 ChatBox AI 简化本地模型对话操作
  • 前端面试笔试题目(一)
  • Docker Hello World
  • UE 5.3 C++ 对垃圾回收的初步认识
  • ARM内核:嵌入式时代的核心引擎
  • 需求分析应该从哪些方面来着手做?
  • 【Unity2D 2022:C#Script】DoTween插件的使用
  • 【Docker】ubuntu中 Docker的使用
  • 【数据结构篇】时间复杂度
  • linux 环境安装 dlib 的 gpu 版本
  • springboot集成钉钉,发送钉钉日报
  • 【机器学习】自定义数据集 使用scikit-learn中svm的包实现svm分类
  • 快速提升网站收录:利用网站历史数据
  • 【Git】初识Git Git基本操作详解
  • Python NumPy(11):NumPy 排序、条件筛选函数
  • AJAX综合案例——图书管理
  • JDK自带工具解析与生产问题定位指南(一)
  • FPGA 使用 CLOCK_DEDICATED_ROUTE 约束
  • 《解锁AI黑科技:数据分类聚类与可视化》
  • Java小白入门教程:Object
  • 记6(人工神经网络
  • stm32硬件实现与w25qxx通信
  • 编程题-最接近的三数之和
  • 索引的底层数据结构、B+树的结构、为什么InnoDB使用B+树而不是B树呢
  • 【工欲善其事】利用 DeepSeek 实现复杂 Git 操作:从原项目剥离出子版本树并同步到新的代码库中
  • 网络编程套接字(中)