当前位置: 首页 > news >正文

LangChain.js 实战系列:如何统计大模型使用的 token 使用量和花费

📝 LangChain.js 是一个快速开发大模型应用的框架,它提供了一系列强大的功能和工具,使得开发者能够更加高效地构建复杂的应用程序。LangChain.js 实战系列文章将介绍在实际项目中使用 LangChain.js 时的一些方法和技巧。

统计调用大模型的 token 使用量,进而统计整体的账单花费,是一个非常基础的需求,在 LangChain.js 中统计 token 的方式有两种,一种是方法的返回,一种是利用回调函数:

1️⃣ 在方法中返回 token 的使用情况,比如 generate()

const chat = new ChatOpenAI({modelName: 'gpt-4',openAIApiKey: 'YOUR_KEY',
})const response = await chat.generate([[new SystemMessage("你是一个翻译专家,可以将中文翻译成法语。"),new HumanMessage("把这个句子翻译从中文翻译成法语:我特别喜欢上班"),]
]);

generate() 方法会返回如下:

{"generations": [[{"text": "J'aime beaucoup travailler."//...}]],"llmOutput": {"tokenUsage": {"completionTokens": 16,"promptTokens": 17,"totalTokens": 33}}
}

llmOutput 字段包含我们整个的 token 使用量,其中 promptTokens 对应的是输入的 token,completionTokens 对应的是输出的 token,对于 OpenAI 来说,输入输出的价格是不一的,如下表:

模型名输入输出
gpt-4$0.03 / 1K tokens$0.06 / 1K tokens
gpt-3.5-turbo-1106$0.0010 / 1K tokens$0.0020 / 1K tokens
gpt-4-1106-preview$0.01 / 1K tokens$0.03 / 1K tokens
gpt-4-1106-vision-preview$0.01 / 1K tokens$0.03 / 1K tokens

2️⃣ 使用回调函数 handleLLMEnd

LangChain 提供了大量方便的回调函数,我们可以利用其提供的内置的 handleLLMEnd() 函数来统计,我们可以在创建 ChatOpenAI 实例的时候注入回调函数:

const chat = new ChatOpenAI({modelName: 'gpt-4',openAIApiKey: 'YOUR_KEY',
}, {callbacks: [{handleLLMEnd(llmResult) {console.log(JSON.stringify(llmResult, null, 2))},}]
})

回调参数 llmResultgenerate() 方法返回值是一样的,同样有包含 tokenUsage

另外也可以在调用的时候再注入回调函数,可以更精细地统计:

model.invoke([new SystemMessage('Only return JSON'),new HumanMessage('Hi there!')],{callbacks: [{handleLLMEnd(llmResult) {console.log(JSON.stringify(llmResult, null, 2))},},],})

好了,希望以上两种方式可以帮助大家统计大模型的开销,护好钱兜。

推荐一个集聊天、工作流和知识库的AI 平台 StarFlow.tech 🚀 。在这里,你可以免费使用 ChatGPT3.5 和 3.5 16K,还有 GPT-4 Vision、DELL·E3、Midjourney 等多种模型可供选择。这个平台就像一个小型工作室,助力个人效率 Max!。

http://www.lryc.cn/news/270008.html

相关文章:

  • 基于多反应堆的高并发服务器【C/C++/Reactor】(中)EventLoop初始化
  • OpenCV(Python)基础—9小时入门版
  • SpringBoot整合Canal
  • 用 Python 提取某一个公众号下的所有文章
  • 鸿蒙4.0实战教学—基础ArkTS(简易视频播放器)
  • 4. 深入 Python 流程控制
  • 2000-2022年上市公司股票流动性指标数据/股票流动性Amihud(原始数据+计算代码+计算结果)
  • Unity 数据存储PlayerPrefs管理类
  • 一篇文章学会如何使用 NestJS 过滤器处理系统全局异常情况
  • ubuntu 守护进程 supervisor
  • SparkStreaming_window_sparksql_reids
  • 爬虫工作量由小到大的思维转变---<第二十四章 Scrapy的`统计数据`收集stats collection ---12月26日补>
  • Kafka:本地设置
  • .NetCore NPOI 读取excel内容及单元格内图片
  • TCP/UDP协议
  • 3D 渲染如何帮助电商促进销售?
  • 使用栈求表达式的值【数据结构】
  • {MySQL}索引事务和JDBC
  • Qt designer界面和所有组件功能的详细介绍(全!!!)
  • mysql_存储过程
  • uboot学习及内核更换_incomplete
  • KVM 自动化脚本的使用及热/冷迁移
  • Unity中Shader裁剪空间推导(在Shader中使用)
  • ES的使用(Elasticsearch)
  • 车牌识别技术,如何用python识别车牌号
  • 爬虫工作量由小到大的思维转变---<第二十五章 Scrapy开始很快,越来越慢(追溯篇)>
  • Servlet入门
  • 【C#与Redis】--高级主题--Redis 哨兵
  • linux安装python
  • 【如何破坏单例模式(详解)】