当前位置: 首页 > news >正文

Fast API + LangServe快速搭建 LLM 后台

如果快速搭建一个 LLM 后台 API,使前端可以快速接入 LLM API。LangChain 或者 LlamaIndex 架构都可以快速集成各种大语言模型,本文将讲述如何通过 Fast API + LangServe 快速的搭建一个后台 Rest API 服务。LLM 这些框架现在主打一个就是快速,不用很多代码就可以完成。

安装依赖

创建 requirements.txt 包含一下类库,大语言模型,我主要使用 Aliyun、Google 或者 Ollama 的,可以根据自己的情况自行替换。pydantic 使用 1.10.13 版本,主要是针对 FastAPI 的一个问题,https://github.com/tiangolo/fastapi/issues/10360,如果不使用 invoke、stream 在 Swagger 中不会生成。

langchain
langchain_community
langserve
fastapi
uvicorn
python-dotenv
langchain-google-genai
dashscope
sse_starlette
pydantic==1.10.13

服务端代码

from fastapi import FastAPI
from langchain.prompts import ChatPromptTemplate
from langchain.chat_models import ChatOpenAI
from langserve import add_routes
import uvicorn
import os
from langchain_community.llms.ollama import Ollama
from langchain_community.llms.tongyi import Tongyi
from langchain_community.chat_models import ChatTongyi
from dotenv import load_dotenv
load_dotenv()app = FastAPI(title="Langchain LLM API",version="1.0",description="A Multi-LLM API with Langchain"
)llm = ChatTongyi(model_name="llama3.1-70b-instruct")prompt2 = ChatPromptTemplate.from_template("Write me a poem about {topic} for a 5-year-old child with 100 words")# Create API Routes with Langchain Pipelines
add_routes(app, prompt2 | llm, path="/poem")if __name__ == "__main__":uvicorn.run(app, host="localhost", port=8000)

在这里插入图片描述

运行并测试

运行程序,通过 /docs 进入 swagger 页面进行测试
http://localhost:8000/docs

在这里插入图片描述

总结

Langchain 整个技术栈使用起来都很方便,无论是接入模型、监控还是对外服务,如果需要监控提示词,可以接入 LangSmith。

http://www.lryc.cn/news/425919.html

相关文章:

  • CSS继承、盒子模型、float浮动、定位、diaplay
  • 使用百度文心智能体创建AI旅游助手
  • 斗破C++编程入门系列之四:运算符和表达式
  • CVPR2024 | PromptAD: 仅使用正常样本进行小样本异常检测的学习提示
  • 文件批量上传,oss使用时间戳解决同名问题 以及一些sql bug
  • 机器学习——线性回归(sklearn)
  • Go 语言切片(Slice) 15
  • 嵌入式开发--STM32G030C8T6,写片上FLASH死机CFGBSY和写入出错
  • 通过Fiddler抓包保存网页上的视频(包括Bilibili、B站和其他视频站)亲测可用
  • 企业为什么需要安装加密软件
  • Spring Web MVC入门(下)
  • uniapp app中使用柱状图 折线图 圆环图和饼图
  • jmreport测试数据库出现 权限不足,此功能需要分配角色 解决方法
  • 这是啥设计模式-适配模式
  • 大语言模型(LLMs)Tokenizers详解
  • 分支-快排/归并---1
  • 代码随想录训练营 Day32打卡 动态规划 part01 理论基础 509. 斐波那契数 70. 爬楼梯 746. 使用最小花费爬楼梯
  • 【智能流体力学】剖析ANSYS Fluent材料属性设定与边界条件
  • 微信小程序反编译工具
  • 线程基本概念
  • 在SpringBoot中执行后台任务
  • 【网络】UDP回显服务器和客户端的构造,以及连接流程
  • 【智能流体力学】ANSYS Fluent工作流程设置、求解和后处理详解
  • 最新UI六零导航系统源码 | 多模版全开源
  • K8S中使用英伟达GPU —— 筑梦之路
  • 2024-2025年最值得选的Java计算机毕业设计选题大全:800个热门选题
  • libnl教程(2):发送请求
  • 【软件测试】功能测试理论基础
  • 玩机进阶教程-----回读 备份 导出分区来制作线刷包 回读分区的写入与否 修改xml脚本
  • MongoDB 插入文档