当前位置: 首页 > news >正文

Claude 3.5 Sonnet模型发布,对比ChatGPT4o孰强孰弱

Anthropic 这家生而为打击 OpenAI 安全问题的公司,正式发布了Claude 3.5 Sonnet模型

用官网的话就是:

今天,我们推出了 Claude 3.5 Sonnet,这是我们即将推出的 Claude 3.5 型号系列中的第一个版本。Claude 3.5 Sonnet 提高了智能的行业标准,在广泛的评估中优于竞争对手型号和 Claude 3 Opus,其速度和成本与我们的中端型号 Claude 3 Sonnet 相当。

Claude 3.5 Sonnet 现在可在 Claude.ai 和 Claude iOS 应用程序上免费使用,而 Claude Pro 和 Team 计划的用户则可以更高的速率限制访问它。它还可通过 Anthropic API、亚马逊 Bedrock 和谷歌云的 Vertex AI 使用。该模型每百万个输入代币收费 3 美元,每百万个输出代币收费 15 美元,代币上下文窗口为 20 万个。

这个图展示了不同版本的Claude模型在智能水平(纵轴)和成本(横轴)上的表现。具体来说,图中有四个点,分别代表Claude 3的三个版本和Claude 3.5的一个版本。

各点的解释:

  1. Claude 3 Haiku

    • 智能水平和成本都相对较低。
    • 适合预算有限的应用场景。
  2. Claude 3 Sonnet

    • 智能水平比Haiku更高,成本也有所增加。
    • 提供了更高的智能水平,但成本相对适中。
  3. Claude 3 Opus

    • 智能水平更高,成本也相应增加。
    • 适合需要更高智能水平且预算较高的应用场景。
  4. Claude 3.5 Sonnet

    • 相比Claude 3 Sonnet,Claude 3.5 Sonnet在智能水平上有显著提升,成本增加。
    • 表示新的版本在智能水平上有较大改进,同时价格也随之上升。

Claude 3.5 Sonnet 在研究生水平推理 (GPQA)、本科生水平知识 (MMLU) 和编码能力 (HumanEval) 方面树立了新的行业基准。它在把握细微差别、幽默和复杂指令方面都有明显进步,在以自然、亲切的语气撰写高质量内容方面更是出类拔萃。

在一次内部代理编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题,优于 Claude 3 Opus 的 38%。我们的评估测试了该模型在自然语言描述所需改进的情况下修复漏洞或为开源代码库添加功能的能力。在获得指导和相关工具后,Claude 3.5 Sonnet 可以独立编写、编辑和执行代码,并具备复杂的推理和故障排除能力。它能轻松处理代码翻译,因此在更新传统应用程序和迁移代码库时特别有效。

请看官方对比图:

Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型,在标准视觉基准测试中超过了 Claude 3 Opus。在解读图表等需要视觉推理的任务中,这些阶跃式的改进最为明显。Claude 3.5 Sonnet 还能从不完美的图像中准确地转录文本--这是零售、物流和金融服务的核心能力,在这些领域,人工智能可能会从图像、图形或插图中获得比单纯从文本中获得更多的洞察力。

https://youtu.be/dhxrHvgXpSM

http://www.lryc.cn/news/401085.html

相关文章:

  • MySQL 分库分表
  • AutoMQ 社区双周精选第十二期(2024.06.29~2024.07.12)
  • Web开发:<div>标签作用
  • 如何使用unittest框架来编写和运行单元测试
  • 2024最新超详细SpringMvc常用注解总结
  • Linux硬件中断(IRQ)的基础知识
  • DP讨论——适配器模式
  • window下tqdm进度条
  • 记录些Redis题集(1)
  • 防火墙双机热备带宽管理综合实验
  • 【Redis】哨兵(sentinel)
  • 2024年高职云计算实验室建设及云计算实训平台整体解决方案
  • 入门实战篇,利用PADS Layout画电阻电容电感的封装
  • 解决npm install 安装报错记录贴
  • CollectionUtils的使用
  • WEB前端03-CSS3基础
  • 【java深入学习第7章】用 Spring Boot 和 Java Mail 轻松实现邮件发送功能
  • Linux抽象套接字
  • GA-Kmeans-Transformer-GRU时序聚类+状态识别组合模型,创新发文无忧!
  • Python面试全攻略:基础知识、特性、算法与实战解析
  • Linux网络编程-socket套接字使用详解
  • Leetcode 236. 二叉树的最近公共祖先
  • GPT-4从0到1搭建一个Agent简介
  • docker镜像源配置
  • 解读InnoDB数据库索引页与数据行的紧密关联
  • 以数据编织,重构数据管理新范式
  • 在linux x86服务器安装jdk
  • 2024智慧竞技游戏俱乐部线下面临倒闭?
  • jmeter分布式(四)
  • 如何解决手机游戏因IP代理被封禁无法正常游戏的问题?