当前位置: 首页 > news >正文

AI智算-k8s部署DeepSeek Janus-Pro-7B 多模态大模型

文章目录

      • 简介
      • 环境依赖
      • 模型下载
      • 下载Janus库
      • GPU环境镜像
      • 模型manifest
      • 调用Janus
        • 多模态
        • 文生图

简介

DeepSeek Janus Pro 作为一款强大的多模态理解与生成框架,正在成为研究人员和开发者的热门选择。本文将详细介绍如何在云原生k8s环境中部署配置和使用 DeepSeek Janus Pro,以及它在多模态任务中的强大功能。

环境依赖

Kubernetes、GPU(H100)

模型下载

参考链接:https://www.modelscope.cn/models/deepseek-ai/Janus-Pro-7B/files

modelscope download --model deepseek-ai/Janus-Pro-7B --local_dir file_CPU_01/modelServing/Janus-Pro-7B/

下载Janus库

git clone  https://github.com/deepseek-ai/Janus.git

GPU环境镜像

modelscope-registry.cn-beijing.cr.aliyuncs.com/modelscope-repo/modelscope:ubuntu22.04-cuda12.1.0-py310-torch2.3.1-tf2.16.1-1.22.2

模型manifest

cat Janus-Pro.yaml 
kind: Deployment
apiVersion: apps/v1
metadata:name: janusprolabels:app: januspro
spec:replicas: 1selector:matchLabels:app: janusprotemplate:metadata:labels:app: janusprospec:schedulerName: volcanovolumes:- name: shmemptyDir:medium: MemorysizeLimit: 512G- name: host-timehostPath:path: /etc/localtimetype: ''- name: model-volumehostPath:path: /file_CPU_01/modelServing/Janus-Pro-7B/type: ''containers:- name: janusproimage: modelscope-registry.cn-beijing.cr.aliyuncs.com/modelscope-repo/modelscope:ubuntu22.04-cuda12.1.0-py310-torch2.3.1-tf2.16.1-1.22.2command: ["/bin/bash", "-c"]args: ["/modelscope_cache/startup.sh"]ports:- name: http-8000containerPort: 8000protocol: TCPenv:- name: MODELSCOPE_CACHEvalue: "/modelscope_cache"resources:limits:nvidia.com/gpu: '8'requests:nvidia.com/gpu: '8'volumeMounts:- name: host-timereadOnly: truemountPath: /etc/localtime- name: shmmountPath: /dev/shm- name: model-volumemountPath: /modelscope_cacheimagePullPolicy: IfNotPresentrestartPolicy: Always
---
kind: Service
apiVersion: v1
metadata:name: janusprolabels:app: januspro
spec:ports:- name: http-7860protocol: TCPport: 7860targetPort: 7860selector:app: janusprotype: NodePort
###模型启动脚本###
cat startup.sh 
#!/bin/bash
# startup.sh# 复制文件
cp /modelscope_cache/Janus-main/frpc_linux_amd64_v0.3 /usr/local/lib/python3.10/site-packages/gradio/frpc_linux_amd64_v0.3# 安装依赖
echo "Installing dependencies..."
cd /modelscope_cache/Janus-main
pip install -e . # 启动
python demo/app_januspro.py --device cuda

调用Janus

kubectl get svc -n sre-tools 
NAME                 TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)           AGE
januspro             NodePort    10.233.38.3     <none>        7860:31456/TCP    3h52m

用宿主机$ip:31456 访问即可

多模态

在这里插入图片描述

文生图

在这里插入图片描述
在这里插入图片描述

PS:
ModelScope server无法直接加载本地下载好的Janus-Pro模型

http://www.lryc.cn/news/532898.html

相关文章:

  • 【截图】selenium自动通过浏览器截取指定元素div的图片
  • 如何导入第三方sdk | 引入第三方jar 包
  • HarmonyOS 5.0应用开发——ContentSlot的使用
  • C#常用集合优缺点对比
  • 基于CLIP视觉语言大模型的行人重识别方法的简单框架设计
  • RabbitMQ 从入门到精通:从工作模式到集群部署实战(三)
  • BurpSuite抓包与HTTP基础
  • SQL Server 数据库迁移到 MySQL 的完整指南
  • 【大模型】DeepSeek与chatGPT的区别以及自身的优势
  • DeepSeek:知识图谱与大模型参数化知识融合的创新架构
  • ES6 迭代器 (`Iterator`)使用总结
  • 信用修复和失联修复的区别
  • 2025蓝桥杯JAVA编程题练习Day3
  • [论文阅读] Knowledge Fusion of Large Language Models
  • deepseek来讲lua
  • 探索 Spring Cloud Alibaba:开启微服务架构新时代
  • 【数据结构】(6) LinkedList 链表
  • 【工具变量】上市公司企业渐进式创新程度及渐进式创新锁定数据(1991-2023年)
  • 07_任务状态——改进播放控制
  • 【R语言】apply函数族
  • Retrieval-Augmented Generation,检索增强生成流程
  • [AI][本地部署]离线升级后报ChromeDb错误
  • Pinocchio: 刚体动力学算法库介绍
  • 电商平台的设计与实现(代码+数据库+LW)
  • c#对接deepseek 聊天AI接口
  • Node.js中http模块(二)
  • 主流顶级域名服务商ZDNS连续十余年跟进国际顶级域名政策制定
  • 低至3折,百度智能云千帆宣布全面支持DeepSeek-R1/V3调用
  • 解释一下数据库中的事务隔离级别,在 Java 中如何通过 JDBC设置事务隔离级别?
  • 【自动化测试】使用Python selenium类库模拟手人工操作网页