当前位置: 首页 > news >正文

如果用大模型考公,kimi、通义千问谁能考高分?

都说大模型要超越人类了,今天就试试让kimi和通义千问做公务员考试题目,谁能考高分?

测评结果再次让人震惊!

问题提干:大小两种规格的盒装鸡蛋,大盒装23个,小盒装16个,采购员小王买了500个鸡蛋,大盒装一共比小盒装(),请问括号中填多少?

备注: 这里稍微改写了下原题描述,避免大模型搜索网上的答案。

Kimi考公

kimi上面的数学计算出现了错误。这是最简单的加减法错误。我告诉他错了。


通过上面的对话可以看出kimi开始给的方程式 23x + 16y=500对的,但是自己无法计算出结果。

后面经过几轮对话,我失去了耐心。。。。

放弃吧~

结论:kimi考公失败

通义千问考公

通义千问开始方程式和kimi一样:23x + 16y=500,但是他一开始认为无解,经过我二次提示,他给出了答案:x=16, y=7,且洋洋得意地计算464+112=500,这也是一个加法错误。

我尝试告诉他有其他答案,这个答案不对。

但是他却倔强地说这是唯一解。

算了算了。

你是唯一解,你没通过考验!

结论:通义千问考公失败

总结

通过上述对话可以看出kimi和通义千问都不具备根据逻辑题目分析和解析方程的能力。

即使使用最笨的方法,从x=1~x=21遍历也能得到答案。

kimi有尝试使用遍历方法,但是不知道为啥直接从x=1跳到了x=14,就跳过了x=12, y=14的题目答案,与答案失之交臂。

通义千问给出了错误答案,坚持到底。

如果您对测评结果有疑问,欢迎交流,更多大模型案例在公众号首发。

#AIGC #kimi #通义千问 #大模型

http://www.lryc.cn/news/334644.html

相关文章:

  • 如何在Java中创建对象输入流
  • Vue 打包或运行时报错Error: error:0308010C
  • 222222222222222222222222
  • 微信小程序 电影院售票选座票务系统5w7l6
  • C#:用定时器监控定时器,实现中止定时器正在执行的任务,并重启
  • 计算机组成原理 — CPU 的结构和功能
  • npm包安装与管理:深入解析命令行工具的全方位操作指南,涵盖脚本执行与包发布流程
  • 序列化结构(protobuf)实现一个TCP服务器(C++)
  • Python中的list()和map() 用法
  • 公网环境下如何端口映射?
  • 7-36 输入年份和月份
  • Linux C++ 023-类模板
  • Android图形显示架构概览
  • 算法学习17:背包问题(动态规划)
  • axios-mock-adapter使用
  • 基于单片机的家用无线火灾报警系统设计
  • LangChain:索引(Indexes)--基础知识
  • Cortex-M4架构
  • 对称排序(蓝桥杯)
  • React - 你使用过高阶组件吗
  • 【C语言】结构体、枚举、联合(自定义类型)
  • 用vue.js写案例——ToDoList待办事项 (步骤和全码解析)
  • 提高大型语言模型 (LLM) 性能的四种数据清理技术
  • Rust 练手小项目:猜数游戏
  • 蓝桥杯物联网竞赛_STM32L071_16_EEPROM
  • 复习知识点整理
  • 7款公司电脑监控软件
  • 服务器 安装1Panel服务器运维管理面板
  • 最大花之能量(蓝桥杯)
  • 探索算力(云计算、人工智能、边缘计算等):数字时代的引擎