当前位置: 首页 > news >正文

萱仔大模型学习记录5-langchain实战

        前面我的bert+lora微调已经跑出了不错的结果,我也学会了如何在bert上使用Lora进行微调,我后续会补充一个医疗意图识别的项目于这个系列,现在这个医疗意图识别代码还暂时不准备公开。我就继续按照我的计划学习一番LangChain。

        LangChain是一个用于构建语言模型应用程序的框架。 LangChain提供了多个模块来简化开发和集成语言模型的过程。以下是 LangChain 的七个主要模块及其详细介绍:

1. LLMs (Language Models)

  • 功能: 这个模块处理与各种语言模型的交互。你可以使用它来加载预训练的语言模型,或者自定义和训练自己的模型。
  • 核心组件:
    • LLM: 用于封装语言模型的基类。
    • OpenAI: 对接 OpenAI 的模型(如 GPT-3, GPT-4)。

2. Prompts

  • 功能: 用于生成和管理提示(prompts),以便有效地与语言模型进行交互。提供了构建和优化提示的工具。
  • 核心组件:
    • PromptTemplate: 用于定义和格式化提示模板。
    • PromptChain: 用于管理多个提示的链式处理。

3. Agents

  • 功能: 允许创建智能代理(agents),这些代理可以处理复杂的任务和对话,并决定如何调用不同的工具或模型。
  • 核心组件:
    • Agent: 处理任务和对话的智能代理。
    • AgentExecutor: 执行代理任务的类。

4. Chains

  • 功能: 用于将多个组件(如提示、模型、数据)连接在一起,以实现更复杂的工作流和数据处理管道。
  • 核心组件:
    • Chain: 基类,用于创建链式工作流。
    • SequentialChain: 按顺序执行多个步骤的链。

5. Memory

  • 功能: 用于管理和存储会话中的信息,以便在对话中保持上下文和状态。
  • 核心组件:
    • Memory: 用于存储和检索会话信息。
    • ConversationBufferMemory: 专门用于对话的缓冲记忆。

6. Tools

  • 功能: 提供了一些工具和功能,用于扩展语言模型的能力,如数据检索、处理和转换。
  • 核心组件:
    • Tool: 基类,用于定义各种工具。
    • APITool: 对接外部API的工具。

7. Callbacks

  • 功能: 提供了回调功能,用于在模型运行过程中进行日志记录、监控和其他自定义操作。
  • 核心组件:
    • CallbackHandler: 用于处理和管理回调操作。
    • Logger: 记录模型运行的日志信息。

LangChain的demo使用方法:

from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, SystemMessage"""
api_key = ""
api_base = ""
model_name = ""
"""chat = ChatOpenAI(model="yi-spark",temperature=0.3,max_tokens=200,api_key='',base_url=""
)messages = [SystemMessage(content="你是一名精通 python 的专家"),HumanMessage(content="写一个  python 的 hello world 程序"),
]response = chat.invoke(messages)print(response.content)

这是运行的结果:

http://www.lryc.cn/news/414807.html

相关文章:

  • 安装使用netron
  • JDFrame 一款比 Java 8 Stream 更灵活的数据处理工具
  • 《Android系统开发中高级定制专栏导读》
  • LeetCode 114. 二叉树展开为链表
  • 78.子集
  • 历史标签如何时间迁移?
  • Jenkins参数化构建
  • 函数实例讲解(三)
  • 如何选择适合自己的编程语言?大学新生入门编程最佳路径指南
  • 编程的法则 依赖倒置原则 (Dependency Inversion Principle)包括如何实践
  • [数据集][目标检测]肾结石检测数据集VOC+YOLO格式1299张1类别
  • pxe安装部署
  • Linux用户-sudo命令
  • Unity强化工程 之 SpriteEditer Multiple
  • 大数据Flink(一百零九):阿里云Flink的基本名称概念
  • 如何利用AI工具延长摸鱼时间、准点下班?
  • Yarn:一个快速、可靠且安全的JavaScript包管理工具
  • 上线前端系统
  • 制作一个不依赖任何基础镜像的docker镜像
  • 【拓扑排序topsort】——启动!!!
  • 计算机网络-http协议和https的加密原理
  • 共享`pexlinux`数据文件的网络服务
  • HC32F4A0 10路串口UART 配置
  • 拯救PyCharm:击退IDE崩溃的终极策略
  • 深入解析Unix命令:掌握wc、whereis和which的使用技巧
  • 奥运会大规模使用中国AI大模型!
  • Linux中的线程3
  • 内网权限维持——利用WMI进行权限维持
  • 【数据结构算法经典题目刨析(c语言)】括号匹配问题(图文详解)
  • 浅谈 Spring AOP框架 (1)