当前位置：首页 > news >正文

RAG实战：构建基于本地大模型的智能问答系统

news 2025/7/7 6:17:14

RAG实战：构建基于本地大模型的智能问答系统

在这里插入图片描述

引言

在当今AI快速发展的时代，如何构建一个既智能又可靠的问答系统是一个重要课题。本文将介绍如何使用RAG（检索增强生成）技术，结合本地大模型，构建一个高效的智能问答系统。

RAG技术简介

RAG（Retrieval-Augmented Generation）是一种结合检索和生成的混合架构，通过以下三个步骤提升AI回答的质量：

检索（Retrieval）
- 从知识库检索相关文档
- 利用向量数据库进行高效存储和检索
- 通过语义相似度找到最相关内容
增强（Augmentation）
- 将检索内容注入提示模板
- 为模型提供准确的上下文
- 确保回答基于可靠信息
生成（Generation）
- 利用大模型生成回答
- 保证回答的准确性和可追溯性

技术栈选择

本项目采用以下技术栈：

LangChain：RAG应用框架
Chroma：向量数据库
Ollama：本地大模型服务
Streamlit：Web界面开发

核心代码实现

1. 环境配置

首先，安装必要的依赖：

# requirements.txt
langchain>=0.1.0
langchain-ollama>=0.0.1
langchain-chroma>=0.0.1
streamlit>=1.31.0
# ... 其他依赖

2. 导入必要模块

from langchain.retrievers import MultiQueryRetriever
from langchain_ollama import ChatOllama, OllamaEmbeddings
from langchain_chroma import Chroma
from langchain.schema.runnable import RunnablePassthrough
from langchain.prompts import ChatPromptTemplate
import streamlit as st

3. 初始化向量数据库和模型

# 初始化嵌入模型
embeddings = OllamaEmbeddings(model="nomic-embed-text",base_url="http://localhost:11434"
)# 初始化向量数据库
db = Chroma(persist_directory="./db",embedding_function=embeddings)# 配置检索器
retriever = db.as_retriever(search_type="similarity",search_kwargs={"k": 5}
)# 初始化语言模型
llm = ChatOllama(model='qwen2.5',base_url="http://localhost:11434",temperature=0
)

4. 构建RAG链

# 创建提示模板
template = """Answer the question based only on the following context:
{context}Question: {question}Answer: """
prompt = ChatPromptTemplate.from_template(template)# 构建RAG链
rag_chain = ({"context": retriever, "question": RunnablePassthrough()}| prompt| llm
)

5. 实现Web界面

def ask_question(question):response_container = st.empty()full_response = ""for chunk in rag_chain.stream(question):full_response += chunk.contentresponse_container.write(full_response)return full_responseif __name__ == "__main__":st.title("RAG 问答系统")user_question = st.text_input("请输入您的问题：")if user_question:st.write("回答：")answer = ask_question(user_question)