当前位置: 首页 > news >正文

大语言模型测评工具-ChatHub和ChatAll

背景

现在国内外拥有上百个大语言模型,在AI业务中,我们需要在其中选择一个合适业务模型,就需要对这些模型进行测试。手工去测试这么多模型效率一定不高,今天就介绍两个提高测评模型效率的工具 ChatHub和ChatAll。

介绍

ChatHub和ChatAll都是all-in-one的方式,集成了市面上主流的大语言模型,可以同时和多个模型对话。

ChatHub

ChatHub是一个国外的项目,它能通过chrome的插件,直接在浏览器上运行。运行后的界面长这样:

这里可以选择多个模型,然后发送消息后,多个模型同时产生回复。

支持的模型种类

支持国外主流模型和开源的模型,也支持自定义接口来扩展本地模型。

ChatAll

ChatAll是国内的项目,github上可以直接下载安装包,支持linux、maxOS、windows,下载地址是下载地址 。下载后打开界面长这样:

在下面选中对应的模型,对话框里就能直接开始对话。有些模型需要登录后才能使用,会弹出一个登录页面。登录后,估计是把cookie给拿过去了,直接去调用对应模型的web接口。有些模型没有web页面,就要通过open api的方式访问,就需要输入对应api的key。

代理支持

国内无法访问ChatGPT,工具里也支持设置代理。

对话总结

在得到多个模型得到回答后,还支持对它们的内容进行总结输出。勾选输出框里的√,然后点击上面的sumarize按钮。

生成总结出的内容:

总体来说,ChatAll比Chathub好用,因为纯免费。也存在一些缺陷,好多模型对话都出问题了。

思考

ChatHub和ChatAll在形式上,帮我们节约了很多模型对接和对话选型的时间。但是选择模型不仅仅是产生对话数据,需要对比评分,最后是看综合得分才会选择某个模型。如果这两个工具能把评价的流程也加入进行,那么就可以在一个工具上,完成模型的选型工作了。

http://www.lryc.cn/news/391333.html

相关文章:

  • 使用redis分布式锁,不要把锁放在本地事务内部
  • Python学生信息管理系统(完整代码)
  • 【大功率汽车大灯升压方案】LED恒流驱动芯片FP7208升压车灯调光应用,PWM内部转模拟,调光深度1%,无频闪顾虑,低亮无抖动
  • uniapp应用如何实现传感器数据采集和分析
  • 读书笔记-Java并发编程的艺术-第3章(Java内存模型)-第6节(final域的内存语义)
  • Spring AI 1.0.0 新变化,从 0.8.1 如何升级
  • 【机器学习】FFmpeg+Whisper:二阶段法视频理解(video-to-text)大模型实战
  • Java中继承接口和实现接口的区别、接口和抽象类的区别、并理解关键字interface、implements
  • Excel为数据绘制拆线图,并将均值线叠加在图上,以及整个过程的区域录屏python脚本
  • 易保全推动区块链应用与AI融合创新发展
  • C++(Python)肥皂泡沫普拉托边界膜曲面模型算法
  • VBA打开其他Excel文件
  • 模拟 ADC 的前端
  • tls各个版本的安全性介绍
  • PHP家政服务预约单开版微信小程序系统源码
  • 数据增强:目标检测算法中的性能提升利器
  • KVB交易平台 :市场迎来新热潮!铜价会持续上涨吗?
  • React@16.x(44)路由v5.x(9)源码(1)- path-to-regexp
  • C#面:String str=new String(“a“)和String str = “a“有什么区别
  • CS算法(二)—— 斜视SAR点目标仿真
  • 2024亚洲国际餐饮展览会(北京餐饮展|火锅展|预制菜展会)
  • 【RabbitMQ问题踩坑】RabbitMQ设置手动ack后,消息队列有多条消息,只能消费一条,就不继续消费了,这是为什么 ?
  • 深度解码:需求跟踪的艺术与实战应用
  • 数据结构——树的基础概念
  • TimerManager和Timer
  • 手写Spring-MVC之前后置处理器与异常处理、数据库框架
  • 学习笔记(linux高级编程)11
  • vite+vue3+nginx配置统一公共前缀
  • android 国内下载Gradle源
  • mysql8一键安装脚本(linux) 拿走即用