当前位置: 首页 > news >正文

Llama2-Chinese项目:7-外延能力LangChain集成

  本文介绍了Llama2模型集成LangChain框架的具体实现,这样可更方便地基于Llama2开发文档检索、问答机器人和智能体应用等。

1.调用Llama2类
  针对LangChain[1]框架封装的Llama2 LLM类见examples/llama2_for_langchain.py,调用代码如下所示:

from llama2_for_langchain import Llama2
# 这里以调用4bit量化压缩的Llama2-Chinese参数FlagAlpha/Llama2-Chinese-13b-Chat-4bit为例
llm = Llama2(model_name_or_path='FlagAlpha/Llama2-Chinese-13b-Chat-4bit', bit4=True)
while True:human_input = input("Human: ")response = llm(human_input)print(f"Llama2: {response}")

2.Llama2 LLM类具体实现
  主要是def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str函数实现。LangChain八股文也不难实现,如下所示:

from langchain.llms.base import LLM
from typing import Dict, List, Any, Optional
import torch,sys,os
from transformers import AutoTokenizerclass Llama2(LLM): # LLM是一个抽象类,需要实现_call方法max_token: int = 2048     # 最大token数temperature: float = 0.1  # 生成温度top_p: float = 0.95       # 生成概率tokenizer: Any            # 分词器model: Any                # 模型def __init__(self, model_name_or_path, bit4=True):super().__init__()self.tokenizer = AutoTokenizer.from_pretrained(model_name_or_path,use_fast=False)self.tokenizer.pad_token = self.tokenizer.eos_tokenif bit4==False: # 32bitfrom transformers import AutoModelForCausalLMself.model = AutoModelForCausalLM.from_pretrained(model_name_or_path,device_map='auto',torch_dtype=torch.float16,load_in_8bit=True)self.model.eval()else: # 4bitfrom auto_gptq import AutoGPTQForCausalLMself.model = AutoGPTQForCausalLM.from_quantized(model_name_or_path,low_cpu_mem_usage=True, device="cuda:0", use_triton=False,inject_fused_attention=False,inject_fused_mlp=False)if torch.__version__ >= "2" and sys.platform != "win32":self.model = torch.compile(self.model)@property # @property装饰器将方法转换为属性def _llm_type(self) -> str:return "Llama2"def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:print('prompt:',prompt)input_ids = self.tokenizer(prompt, return_tensors="pt",add_special_tokens=False).input_ids.to('cuda')generate_input = {"input_ids":input_ids,"max_new_tokens":1024,"do_sample":True,"top_k":50,"top_p":self.top_p,"temperature":self.temperature,"repetition_penalty":1.2,"eos_token_id":self.tokenizer.eos_token_id,"bos_token_id":self.tokenizer.bos_token_id,"pad_token_id":self.tokenizer.pad_token_id}generate_ids = self.model.generate(**generate_input)generate_ids = [item[len(input_ids[0]):-1] for  item in generate_ids]result_message = self.tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]return result_message # 返回生成的文本

参考文献:
[1]https://github.com/FlagAlpha/Llama2-Chinese/blob/main/examples/llama2_for_langchain.py
[2]https://github.com/langchain-ai/langchain

http://www.lryc.cn/news/182371.html

相关文章:

  • ES6中数组的扩展
  • 计算机考研 | 2016年 | 计算机组成原理真题
  • Web版Photoshop来了,用到了哪些前端技术?
  • FL Studio21.1.0水果中文官方网站
  • [BJDCTF2020]Mark loves cat
  • @SpringBootApplication注解的理解——如何排除自动装配 分布式情况下如何自动加载 nacos是怎么被发现的
  • HTTP的前世今生
  • 软件测试教程 自动化测试selenium篇(二)
  • JavaSE入门--初始Java
  • leetcode做题笔记160. 相交链表
  • 数学建模Matlab之检验与相关性分析
  • 微服务网关:Spring Cloud Zuul 升级 Spring Cloud Gateway 的核心要点
  • 视频讲解|含可再生能源的热电联供型微网经济运行优化(含确定性和源荷随机两部分代码)
  • 3种等待方式,让你学会Selenium设置自动化等待测试脚本!
  • [Spring] Spring5——AOP 简介
  • C/C++ 动态规划面试算法题
  • kafka伪集群部署,使用zookeeper模式
  • Postgresql 主从复制+主从切换(流复制)
  • java获取字符串集合中每个字符并且组成一个新的集合实现
  • 结构型设计模式——外观模式
  • 【算法学习】-【双指针】-【快乐数】
  • 【Java-LangChain:使用 ChatGPT API 搭建系统-6】处理输入-链式 Prompt Chaining Prompts
  • 从零手搓一个【消息队列】创建核心类, 数据库设计与实现
  • 14:00面试,14:06就出来了,这问的过于变态了。。。
  • url请求头信息
  • 【Oracle】Oracle系列之十六--数据库备份
  • uni-app:实现页面效果3
  • 计算机网络基础(一):网络系统概述、OSI七层模型、TCP/IP协议及数据传输
  • 互联网金融理财知识点简单总结
  • 微信小程序template界面模板导入