当前位置：首页 > news >正文

如果用大模型考公，kimi、通义千问谁能考高分？

news 2025/8/18 9:16:54

都说大模型要超越人类了，今天就试试让kimi和通义千问做公务员考试题目，谁能考高分？

测评结果再次让人震惊！

问题提干：大小两种规格的盒装鸡蛋，大盒装23个，小盒装16个，采购员小王买了500个鸡蛋，大盒装一共比小盒装()，请问括号中填多少？

备注： 这里稍微改写了下原题描述，避免大模型搜索网上的答案。

Kimi考公

kimi上面的数学计算出现了错误。这是最简单的加减法错误。我告诉他错了。

通过上面的对话可以看出kimi开始给的方程式 23x + 16y=500对的，但是自己无法计算出结果。

后面经过几轮对话，我失去了耐心。。。。

放弃吧~

结论：kimi考公失败

通义千问考公

通义千问开始方程式和kimi一样：23x + 16y=500，但是他一开始认为无解，经过我二次提示，他给出了答案：x=16, y=7，且洋洋得意地计算464+112=500，这也是一个加法错误。

我尝试告诉他有其他答案，这个答案不对。

但是他却倔强地说这是唯一解。

算了算了。

你是唯一解，你没通过考验！

结论：通义千问考公失败

总结

通过上述对话可以看出kimi和通义千问都不具备根据逻辑题目分析和解析方程的能力。

即使使用最笨的方法，从x=1~x=21遍历也能得到答案。

kimi有尝试使用遍历方法，但是不知道为啥直接从x=1跳到了x=14，就跳过了x=12, y=14的题目答案，与答案失之交臂。

通义千问给出了错误答案，坚持到底。

如果您对测评结果有疑问，欢迎交流，更多大模型案例在公众号首发。

#AIGC #kimi #通义千问 #大模型

查看全文

http://www.lryc.cn/news/334644.html

如何在Java中创建对象输入流

Vue 打包或运行时报错Error: error:0308010C

222222222222222222222222

微信小程序电影院售票选座票务系统5w7l6

C#：用定时器监控定时器，实现中止定时器正在执行的任务，并重启

计算机组成原理 — CPU 的结构和功能

npm包安装与管理：深入解析命令行工具的全方位操作指南，涵盖脚本执行与包发布流程

序列化结构(protobuf)实现一个TCP服务器(C++)

Python中的list()和map() 用法

LangChain：索引(Indexes)--基础知识

Cortex-M4架构

对称排序（蓝桥杯）

React - 你使用过高阶组件吗

【C语言】结构体、枚举、联合(自定义类型)

用vue.js写案例——ToDoList待办事项（步骤和全码解析）

提高大型语言模型 (LLM) 性能的四种数据清理技术

Rust 练手小项目：猜数游戏

蓝桥杯物联网竞赛_STM32L071_16_EEPROM

探索算力（云计算、人工智能、边缘计算等）：数字时代的引擎

Kimi考公

结论：kimi考公失败

通义千问考公

结论：通义千问考公失败

总结

相关文章：