当前位置：首页 > news >正文

基于大模型LLM 应用方案

news 2025/6/28 19:34:31

现如今LLM 应用面临的主要问题

准确性，2. 高成本，3. 专业性，4. 时效性，5. 安全性

信息偏差/幻觉 (大模型由于数据缺陷/知识边界会使用可靠性下降)
知识更新滞后性（LLM 基于静态数据集训练，可能导致知识更新滞后，无法及时反映最新信息动态。）
内容不可追溯：（LLM 生成的内容往往缺乏明确的信息来源，影响内容的可信度。）
推理能力限制：（LLM 可能缺乏必要的推理能力）
长文本处理能力较弱：（受限于有限的上下文窗口，处理速度随着输入长度增加而减慢）

主流方案

无训练成本

直接使用已经训练好的预训练模型，不需要额外训练，

1. 只通过输入或微调提示（Prompt Engineering）实现功能。

System Prompt + ICL（In-Context Learning）在 Prompt 中提供示例，模型基于示例进行推理+ CoT（Chain of Thought）通过推理链分步引导，模型逐步推理以提高复杂问题的解决能力：
提供明确的上下文和示例，指导模型分步骤推理，增强回答质量。

2. 限定回答范围（Guidance）：通过明确的指令限制模型输出格式和范围。

3. Retrieval Augmented Generation (RAG)通过检索外部知识，补充模型的生成能力。

langchain

基于检索返回的内容做Prompt增强
当前完整的 RAG 应用流程主要包含两个阶段：
- 数据准备阶段：数据提取——>文本分割——>向量化（embedding）——>数据入库
- 应用阶段：用户提问——>数据检索（召回）——>注入 Prompt——>LLM 生成答案
Bing-like 模式
结合全网搜索结果，增强模型的知识范围调用通用搜索引擎（如 Bing、Google）。调用通用搜索引擎（如 Bing、Google）。

Perplexity.ai

Google Search Labs

4. Function Call + Plugins 通过外部工具（如函数调用、插件）扩展模型能力。

Function calling

5. Ensemble/Bagging 通过多次调用模型，使用不同提示或结果整合，提升回答的质量和一致性。

Med-PaLM 2

CoT-SC（Self-Consistency）：对一个问题生成多个答案，投票选出最佳答案。
Prompt Bagging：使用多个设计不同的 Prompt 输入，结合结果进行优化。
Ensemble Refinement：利用多个模型分别生成答案，最后组合成最终输出。

6.Reflection/System2 像人类一样非线性思考问题、reasoning、planning

ReAct、ToT

有训练成本

1. SFT（Supervised Fine-Tuning）通过监督微调对模型进行对齐（Alignment）

Full FT（全模型微调）：调整整个模型参数，适合大规模定制。
PEFT（Parameter-Efficient Fine-Tuning）：只调整部分参数（如 LoRA），资源友好。

具体方案

准备标注数据集。
选择微调方法：
- 全模型微调（Full Fine-tuning）。
- 参数高效微调（PEFT），如 LoRA。
使用分布式训练框架（如 Hugging Face Trainer）进行训练。

2. 增量预训练（Incremental Pretraining）增量预训练（Incremental Pretraining）

在特定领域数据上继续预训练模型，增强领域能力。 MOE

3. MOE（Mixture of Experts）MOE（Mixture of Experts）

通过动态激活模型的部分模块，提升大模型的训练效率和推理能力。好的数据配比、数据质量、训练技巧、训练资源。

总结建议

如果需要快速实现功能、资源有限，优先选择无训练成本方案，如：
- 使用 Prompt Engineering（ICL + CoT）改进回答质量。
- 结合检索增强模型（RAG）。
- 借助 Function Call 和 Plugin 扩展功能。
如果追求高精度、领域定制化或长期优化，选择有训练成本方案，如：
- 使用 SFT 对齐模型输出格式。
- 在特定领域内增量预训练或全面预训练新模型。

选择具体实现方案需根据应用场景、技术资源和业务需求综合评估。

http://www.lryc.cn/news/511143.html

相关文章：

实用技巧：关于 AD修改原理图库如何同步更新到有原理图的解决方法

区块链平台安全属性解释

Machine-learning the skill of mutual fund managers

Windows下Python+PyCharm的安装步骤及PyCharm的使用

Anaconda＋PyTorch（CPU版）安装

第 28 章 - ES 源码篇 - Elasticsearch 启动与插件加载机制解析

机床数据采集网关在某机械制造企业的应用

美团Android开发200道面试题及参考答案（上）

MQTT协议的应用场景及特点和常见的概念03

电脑缺失sxs.dll文件要怎么解决？

数据处的存储与处理——添加数组

24-12-28-pytorch深度学习CUDA的GPU加速环境配置步骤

YOLO系列正传（五）YOLOv4论文精解（上）：从CSPNet、SPP、PANet到CSPDarknet-53

【AIGC-ChatGPT副业提示词指令 - 动图】魔法咖啡馆：一个融合创意与治愈的互动体验设计

AIGC在电影与影视制作中的应用：提高创作效率与创意的无限可能

第三百四十六节 JavaFX教程 - JavaFX绑定

IDEA+Docker一键部署项目SpringBoot项目

vue Promise使用

Tomcat调优相关理解

uni-app开发-识图小程序-主要功能以及首页实现

vue3 ref reactive响应式数据，赋值的问题、解构失去响应式问题

算法常用库函数——C++篇

怎么把多个PDF合并到一起-免费实用PDF编辑处理工具分享

RFC协议简要介绍——有关TCP拥塞控制的RFC

Speckly：基于Speckle文档的RAG智能问答机器人

香橙派5Plus启动报错bug: spinlock bad magic on cpu#6, systemd-udevd/443

电子应用设计方案74：智能家庭对讲系统设计

node js 过滤空白行

武泳樽携手AI AD Manager荣获红点奖,智能广告管理系统备受瞩目