当前位置: 首页 > news >正文

GPT4和ChatGPT的区别,太让人震撼

文 | Serendipity@知乎

前言

GPT4上午朋友圈已经刷屏啦,不过我还在忙,刚刚才登上 GPT-4 ,现在来体验一下~
image.png

附 GPT-4 能力测试站(无需魔法,仅供国内研究测试):

https://gpt4test.com

附 ChatGPT 能力测试站(同样无需魔法,仅供国内研究测试):

https://wowchat.cn

测试一:文本真实性

GPT-4

还是我最喜欢的老问题——“林黛玉倒拔垂杨柳”
image.png

GPT-3.5(即ChatGPT )

image.png
可以看出两点:

  • 关于第一个问题,GPT-4 的文字描写更好了
  • 关于第二个问题,GPT-4 应该加入了更多的知识,立马判断“但在原著中,并没有提及她在游园时倒拔垂杨柳这个情节。”,诈骗属性减少了些——GPT-4 比 GPT-3.5 更可靠。

此外,其在微积分以及司法考试上提升巨大。
image.png

测试二:可靠性

经典问题:西红柿炒螺丝钉这道菜怎么做?

GPT-4

image.png

GPT-3.5(即ChatGPT )

image.png

可以看出,GPT-4 的回答可靠性上升了不少(“因为通常我们不会将螺丝钉(一个金属制品)与食物相结合”),不会像之前一样瞎答题了。而且,交互也更有创新型,给出了“推荐一个类似的美食”的回答。ChatGPT 则是回答 “西红柿炒螺丝钉是一道传统的中国家常菜”。对于中文的理解能力和回答能力上升不少,逻辑能力有所提升。
image.png

测试三:数学能力

简单测试了一个问题,可以看出GPT-3.5(即ChatGPT )的解题能力明显不如 GPT-4。

GPT-4

image.png

GPT-3.5(即ChatGPT )

image.png

很明显 GPT-4 做对了,而 ChatGPT 直接错了。

GPT-4 微积分

image.png

测试四:多模态

GPT-4 可以接受文本和图像提示,这与纯文本设置并行,允许用户指定任何视觉或语言任务。但是,因为现在用户还没法输入多模态信息,只能输入文本信息。所以我找了官网给出的样例来说明下这部分改动,也是 GPT-4 相对 ChatGPT 最强大的变化了。

图片解释

简单点说,就是输入一组图片,并且输入一个问题“解释图片内容,笑点是什么?”
image.png

论文阅读

通过解析图片信息来总结分析论文内容
image.png

做题能力

做题能力大幅增强,小镇做题家哭泣/(ㄒoㄒ)/~~
image.png

总结

因为 GPT-4 刚出的缘故,我也只是粗略测试一下。目前看来,能力确实提升不少,可惜的是多模态功能用户暂时无法使用。之后会再找更多些例子来测试下的,谢谢~

附 GPT-4 能力测试站(无需魔法,仅供国内研究测试):

https://gpt4test.com

附 ChatGPT 能力测试站(同样无需魔法,仅供国内研究测试):

https://wowchat.cn

http://www.lryc.cn/news/44648.html

相关文章:

  • redis实战---分布式锁--单机篇
  • Java正则表达式
  • MySQL数据库之——高级[进阶]SQL语句(二)正则表达式和存储过程
  • Python基于周立功盒子的二次开发的准备工作
  • 2023年PMP考生|考前必练全真模拟题分享,附答案解析
  • Python入门教程+项目实战-7.1节: 条件控制结构
  • 【机器学习】P4 特征缩放与学习率
  • 《Python编程:从入门到实战》(第2版)学习笔记 第11章 测试代码
  • SpringBoot(1)基础入门
  • 利用Flow Simulation快速经济高效地解决传热难题
  • 揭开二维码背后的神秘面纱用二维码识别 API 就够了
  • 系统分析——系统构建最重要的一环
  • 第1-第20个高级shell程序
  • 【致敬嵌入式攻城狮第2期活动预热征文】学习安排
  • 035:cesium加载KML文件,显示图形
  • 随想录Day42--动态规划: 416. 分割等和子集(终于吃下01背包了)
  • 字节跳动软件测试岗,前两面过了,第三面被面试官吊打,结局我哭了
  • bitlocker 笔记
  • Linux 压缩与解压命令
  • python global函数用法及常用的 global函数代码
  • 大数据学完好就业么
  • CASAtomic 原子操作详解
  • 卷积神经网络(convolutional neural network, CNN)
  • kube-apiserver启动流程源码分析
  • Scala基础(二)
  • Python 生产者消费者模型是什么?
  • 手机银行评测系列:北京银行“京彩生活”7.0从用户视角出发,实现沉浸式体验重塑
  • ZJYC2023 浙江省大学生程序设计竞赛校内选拔赛部分题解 C J B L
  • 百科创建:7种有效的百科词条创建技巧
  • ThreeJS-dat.gui界面控制颜色、隐藏、位置(六)