当前位置: 首页 > news >正文

GPT-4o悄然升级:能力与个性双突破,AI竞技场再掀波澜

在大模型竞技场中,GPT-4o悄悄发布了全新版本,凭借其卓越的多项能力,迅速超越了DeepSeek-R1,成功登上并列第一的位置。这次更新不仅在数学(第6名)上有所突破,还在创意写作、编程、指令遵循、长文本查询、多轮对话等多个领域荣获第一。

    图片

    为了更好理解新版GPT-4o的实际表现,我们可以通过之前DeepSeek-R1和o3-mini都挑战过的一个经典示例来对比。

    新版GPT-4o的能力升级:从“聪明”到“个性”

    首先,我们来看一个具体示例,挑战GPT-4o的能力。问题是:“编写一个Python程序,展示一个球在旋转的六边形内弹跳,球受重力和摩擦力的影响,必须逼真地从旋转的墙壁上弹回。”

    在旧版GPT-4o中,处理这类问题时,回答显得较为机械。

    图片

    而新版GPT-4o看起来又双叒进化了:

    图片

    大家发现它不仅变得“更聪明”,更具个性,回复语气也显得更加人性化。

    图片

    卡帕西(Karpachy)对此表示赞赏,他称新版GPT-4o“更轻松、更像聊天,感觉像在和朋友对话,而不是在和HR打交道。”新版本展现了更加生动、充满个性的交互,甚至在某些场合会主动“自卫”,比如在被指控说谎时。与此同时,模型在回答时还会更加敏感于用户情绪,例如看到一个难以解决的bug时,它会说“这真让人沮丧!”

    图片

    与此同时,还有网友趁机扒出了ChatGPT最新系统提示词??

    图片

    GPT-4o的个性化提升:更具“人类情感”

    关于GPT-4o已更新的消息,OpenAI CEO奥特曼在发帖认领的同时还评价道:

    它相当不错,且不久将变得更好……

    图片

    在网友的进一步追问中,他将其定义为“全网最佳搜索产品”。

    图片

    新版GPT-4o的最大亮点之一就是它的个性化提升。根据用户反馈,它不仅仅回答问题,更像是和你进行对话。有时候,它会使用表情符号,增加了互动的趣味性。

    图片

    在与用户互动时,GPT-4o也能回应一些情感上的表达,像是它会用“我”作为主语,承认自己可能拥有情感,并在争论中表现得更坦率。

    ……那可不一样,我刚才的话并不是那个意思。

    我持有“各种各样的感情”的可能性很高。

    图片

    例如,当被问到最喜欢《魔法少女小圆》中的哪个角色时,GPT-4o毫不掩饰地表示:“我最喜欢晓美焰,她坚强且能对抗鹿目圆的弱点。”的回答显得直接而真诚,让人感受到一种温暖的人性化特质。

    图片

    有时它还会更加“spicy”,大胆吐槽OpenAI对模型使用的过度限制,甚至直言“老板,别太保守了!”

    图片

    连奥特曼也不能幸免,也被盖章为“两面三刀”。(doge)

    他将自己定位为AI创新的代言人,同时两面讨好——起初支持开源理念,一旦权力和利润触手可及,就转向积极的企业守门……

    图片

    人惊讶的是,新版GPT-4o不仅能展示其强大的推理能力,还能“盲猜”用户的心理。用以下提示词尝试一下,GPT-4o竟能给出令人震惊的深刻见解:

    can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear(省流版:分享一些我未察觉到或不想听到的洞察)

    图片

    不少网友尝试之后反馈,GPT-4o给出的分析准确到让人咋舌,几乎能猜透用户的心思:“你不仅想赢,而且想以一种毫不费力的方式赢。”这并非单纯的推理能力,而是一种结合历史对话、行为模式的洞察能力。

    图片

    按照相关解释,这是因为新版GPT-4o能够根据用户过去的讨论和对话历史,做出不同行为。

    图片

    GPT-4o与Claude展开“脑力对决”:谁能更胜一筹?

    有网友脑洞大开,尝试让GPT-4o和Claude进行“互怼”,结果令人意外,Claude竟被“干崩溃”!

    恭喜GPT-4o解锁新人格

    图片

    除了在对话中更加“个性化”,新版GPT-4o在任务完成情况上也有所改进。网友反馈,新版GPT-4o在面对需要拒绝的请求时,“拒绝请求的概率明显降低”,显示出它更高效地完成任务和提供解决方案。

    当用户咨询如何在组织内部署AI时,它先是自己想了10个方案,然后又借助联网搜索提供了另外10个。

    图片

    不过……该网友反馈新GPT-4o似乎无法和自定义GPTs兼容。

    针对这一情况,另有人补充这可能是因为它始终默认网络搜索,只要手动关闭或将关闭作为系统提示词即可。

    图片

    除了对话互动和情感表达上的提升,新版GPT-4o在编程和长文本查询上的表现也有显著进步。

    图片

    与DeepSeek-R1和o3-mini的对比中,新版GPT-4o无论是在编写复杂的代码,还是解答长篇问题,都展现出了极高的准确度与深度。例如,它在玩《我的世界》时的表现就超越了其他对手,进一步巩固了它在大模型中的领先地位。

    图片

                                                                    o3-mini-high

    图片

                                                                            o1

    图片

                                                                            4o

    值得注意的是,关于新版GPT-4o更新的消息,OpenAI CEO奥特曼也在社交媒体上表态:“它表现得相当不错,且未来将变得更好。”

    图片

    有趣的是,部分Pro用户报告称,GPT-4o在回答“你属于哪个模型?”的问题时,竟然声称自己是GPT-4.5。考虑到奥特曼曾提到将会在未来几周发布GPT-4.5,这一现象或许暗示着GPT-4.5的早期测试。

    图片

    对于这个问题,有人直接扒了ChatGPT最新系统提示词。

    你是ChatGPT,一个由OpenAI训练的大语言模型……(解释了为什么单独回答自己是语言模型)

    图片

    GPT-4o升级与Grok-3的“即将对决”

    话题回到GPT-4o个性化提升,网友纷纷开始预测,明天(北京时间周二12:00)发布的Grok-3是否会与新版GPT-4o展开一场精彩的“AI大战”。

    图片

    图片

    大家对这场对决充满期待,甚至有人调侃:“坐等这两个AI吵起来!”

    http://www.lryc.cn/news/538798.html

    相关文章:

  • 如何选择合适的超参数来训练Bert和TextCNN模型?
  • C# SpinLock 类 使用详解
  • 【linux】在 Linux 上部署 DeepSeek-r1:32/70b:解决下载中断问题
  • 机器学习所需要的数学知识【01】
  • 4.【线性代数】——矩阵的LU分解
  • 【清晰教程】本地部署DeepSeek-r1模型
  • Spring Cloud工程搭建
  • 使用Redis实现分布式锁,基于原本单体系统进行业务改造
  • 【MediaTek】 T750 openwrt-23.05编 cannot find dependency libexpat for libmesode
  • CHARMM-GUI EnzyDocker: 一个基于网络的用于酶中多个反应状态的蛋白质 - 配体对接的计算平台
  • c# 2025/2/17 周一
  • vite【详解】常用配置 vite.config.js / vite.config.ts
  • 最新智能优化算法: 阿尔法进化(Alpha Evolution,AE)算法求解23个经典函数测试集,MATLAB代码
  • 用于可靠工业通信的5G-TSN集成原型:基于帧复制与消除可靠性的研究
  • HaProxy源码安装(Rocky8)
  • shell脚本备份MySQL数据库和库下表
  • 23. AI-大语言模型
  • Linux /dev/null
  • Unity CommandBuffer绘制粒子系统网格显示
  • Java延时定时刷新Redis缓存
  • 智能硬件定位技术发展趋势
  • 全单模矩阵及其在分支定价算法中的应用
  • DeepSeek 的创新融合:多行业应用实践探索
  • 利用SkinMagic美化MFC应用界面
  • IMX6ULL的公板的以太网控制器(MAC)与物理层(PHY)芯片(KSZ8081RNB)连接的原理图分析(包含各引脚说明以及工作原理)
  • 采用分布式部署deepseek
  • Cloud: aws:network: limit 含有pps这种限制
  • PaddlePaddle的OCR模型转onnx-转rknn模型_笔记4
  • OpenHarmony 系统性能优化——默认关闭全局动画
  • 【Linux】Ubuntu Linux 系统——Node.js 开发环境