当前位置: 首页 > article >正文

大模型模型部署和暴露接口

创建环境

激活案件

安装相关依赖

conda create -n fastApi python=3.10
conda activate fastApi
conda install -c conda-forge fastapi uvicorn transformers pytorch
pip install safetensors sentencepiece protobuf

 新建文件夹

mkdir App
cd App
touch main.py

复制代码main.py

from fastapi import FastAPI
from transformers import AutoModelForCausalLM, AutoTokenizer
import torchapp = FastAPI()# 模型路径
model_path = "/root/autodl-tmp/Models/deepseek-r1-1.5b-merged"# 加载 tokenizer (分词器)
tokenizer = AutoTokenizer.from_pretrained(model_path)# 加载模型并移动到可用设备(GPU/CPU)
device = "cuda" if torch.cuda.is_available() else "cpu"
model = AutoModelForCausalLM.from_pretrained(model_path).to(device)@app.get("/generate")
async def generate_text(prompt: str):# 使用 tokenizer 编码输入的 promptinputs = tokenizer(prompt, return_tensors="pt").to(device)# 使用模型生成文本outputs = model.generate(inputs["input_ids"], max_length=150)# 解码生成的输出generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)return {"generated_text": generated_text}

运行app.py文件

uvicorn main:app --reload --host 0.0.0.0

 可能报错,升级 huggingface-hub,运行以下命令升级到兼容版本

pip install --upgrade huggingface-hub
uvicorn main:app --reload --host 0.0.0.0

浏览器打开

http://localhost:8000/docs

后端接口 

 然后就是做一个网站调用大模型接口,类似如下

前端项目:https://github.com/huangyf2013320506/magic_conch_frontend.git

npm instal1
npm run dev

后端项目:https://github.com/huangyf2013320506/magic_conch_backend.git

记得把jdk改一下,之前一直用的是1.8

把网址改成"http://127.0.0.1:5173",因为前端网址是这 

 编译一下 

 然后运行启动就行,注意要在在MagicconchBackendApplication.java 类中启动

http://www.lryc.cn/news/2403232.html

相关文章:

  • 2025服装收银系统推荐:智能管理助力服装商家高效经营
  • Microsoft Copilot Studio - 尝试一下Agent
  • 【Python 算法零基础 4.排序 ⑨ 堆排序】
  • Deepseek/cherry studio中的Latex公式复制到word中
  • 测试设计技术全解析:黑盒与白盒测试的七种武器与覆盖率指标
  • AWS中国区IAM相关凭证自行管理策略(只读CodeCommit版)
  • 极限复习c++
  • 32单片机——窗口看门狗
  • javascript中Cookie、BOM、DOM的使用
  • IDEA 中 Undo Commit,Revert Commit,Drop Commit区别
  • DAY43打卡
  • Leetcode 1892. 页面推荐Ⅱ
  • 进程——环境变量及程序地址空间
  • (4-point Likert scale)4 点李克特量表是什么
  • 亚矩阵云手机实测体验:稳定流畅背后的技术逻辑​
  • VR视频制作有哪些流程?
  • NodeJS全栈WEB3面试题——P2智能合约与 Solidity
  • 某水表量每15分钟一报,然后某天示数清0了,重新报示值了 ,如何写sql 计算每日水量
  • Ubuntu 系统部署 MySQL 入门篇
  • 【MATLAB代码】制导——平行接近法,三维,目标是运动的,订阅专栏后可直接查看MATLAB源代码
  • 大模型安全测试报告:千问、GPT 全系列、豆包、Claude 表现优异,DeepSeek、Grok-3 与 Kimi 存在安全隐患
  • vue3 按钮级别权限控制
  • vue3子组件获取并修改父组件的值
  • 【Redis】Cluster集群
  • 黑马Java面试笔记之 微服务篇(SpringCloud)
  • CLIP多模态大模型的优势及其在边缘计算中的应用
  • 基于STM32语音识别柔光台灯
  • 基于PSO粒子群优化的VMD-GRU时间序列预测算法matlab仿真
  • 探索未知惊喜,盲盒抽卡机小程序系统开发新启航
  • 基于开源AI大模型与AI智能名片的S2B2C商城小程序源码优化:企业成本管理与获客留存的新范式