当前位置: 首页 > news >正文

DeepSeek R1模型解读与使用

字节在春节前发布了doubao-1.5,它的官方介绍竟然是这样的:

这次发布了四个型号,doubao-1.5-pro-32k, doubao-1.5-pro-256k, doubao-1.5-lite-32k, doubao-1.5-vision-pro-32k,价格全部与上一个版本doubao模型一致,加量不加价。这次他们官方除了展示示例,也直接提供了模型指标的对比。

1、Doubao-1.5-pro

  • Knowledge(通用知识):这里对标的都是目前最好的国内外模型。先看通用知识这一块,在MMLU_PRO和GPQA这两个高难度测试集上,表现优于其他所有模型。在MMLU上仅次于GPT4o-0806。
  • Math(数学):仅次于Gemini-exp-1205(不是Gemini2.0,是Gemini的周年庆版),超过了Deepseek V3。
  • Code(代码):McEval和FullStackBench评分第一,MBPP+Deepseek V3最高。
  • Reasoning(推理):DROP指标登顶,BBH不如其他顶级模型。
  • Instruction Following(指令遵循):优于DeepSeek V3, 不如Claude3.5 sonnet以及Gemini-exp-1205
  • 中文能力:CMMLU和C-Eval评分最高。在中文写作能力方面,豆包系列原本就很强,贯彻系列一贯的优势。

从豆包的这个评测报告上来看,多项指标领先世界,综合能力很强。并且在对比中,Qwen2.5和Deepseek V3占不到什么优势。

2、Doubao-1.5-lite

Doubao-1.5-lite 在轻量版语言模型中处于全球一流水平,在综合(MMLU_pro)、推理(BBH)、数学(MATH)、专业知识(GPQA)权威测评指标持平或超越 GPT-4omini、Cluade 3.5 Haiku。

Doubao-1.5-lite-32k-250115 模型版本效果比肩9月份发布的pro系列模型 Doubao-pro-32k-240828。意味着在众多场景中,可以用 lite 模型的成本,获得此前 pro 模型的效果,价格反而还更低了。

3、Doubao-1.5-vision-pro-32K

豆包1.5的视觉模型评测,这里指标分为大学级问题(College-level Problems),数学推理(Mathematical Reasoning),文档与图表解读(Document and Diagrams Reading),通用视觉问答(General Visual Question Answering),空间与计数理解(Spatial and Counting Understanding),视频理解(Video Understanding)。

我们可以看到,在一半以上的指标,豆包视觉模型都排在第一,即使没有排第一,一般也是第二。确实非常强了。

4、模型基本规格与计费

可以说是目前的极致性价比了,对原来的模型做了极大的加强并且价格不变。而豆包的视觉模型,目前的性价比更是无人能敌。

5、总评

近一个月顶级国产模型纷纷刷屏,先是deepseek v3和deepseek r1,平替国外旗舰模型和o1。后有MiniMax-Text-01,不但综合能力顶流,支持多模态,并且是业界长上下文能力最强的模型。现在又有豆包1.5,性能直接全面超越其他旗舰模型,并做到了最便宜的价格。

如果豆包保持现在的竞争力,一两年后甚至我们能看到字节出海反攻OpenAI,复刻TikTok国际市场上的业绩。

好了,今天就到这里,虽然大家也可以在豆包的应用上直接使用豆包模型,不过高通智匠也会同步更新这些模型。有问题欢迎加群交流,我们下期再见。

http://www.lryc.cn/news/525567.html

相关文章:

  • Windows电脑不小心点击了关机,关机过程中如何阻止
  • CNN-GRU卷积门控循环单元时间序列预测(Matlab完整源码和数据)
  • 【吉林乡镇界】面图层shp格式arcgis数据乡镇名称和编码wgs84无偏移内容测评
  • fpga学习入门 串口rs232回环
  • 智启未来,AI筑梦科技新星”------华清远见成都中心2025冬令营圆满结束
  • 接上篇基于Alertmanager 配置钉钉告警
  • DDD - 如何设计支持快速交付的DDD技术中台
  • JAVA与数据结构-线性表
  • C++|开源日志库log4cpp和glog
  • React Context 实现全局组件注册
  • 基于AutoDL云计算平台+LLaMA-Factory训练平台微调本地大模型
  • strdup 函数
  • 2.9/Q2,Charls最新文章解读!
  • 【未完成】springboot项目实现扫码登录相关逻辑
  • html、js、css实现爱心效果
  • 【前端】Hexo 建站指南
  • OpenStack基础架构
  • 1905电影网中国地区电影数据分析(一) - 数据采集、清洗与存储
  • IPhone16 Plus 设备详情
  • 埃氏算法C++实现: 快速输出质数( 素数 )
  • 后端的config包中的常用配置
  • 基于亿坊PHP框架构建物联网解决方案的优势分析!
  • IoTDB结合Mybatis使用示例(增删查改自定义sql等)
  • skynet 源码阅读 -- 启动主流程
  • OpenCV:高通滤波之索贝尔、沙尔和拉普拉斯
  • UDP 广播组播点播的区别及联系
  • STM32补充——IAP
  • Jetson Xavier NX (ARM) 使用 PyTorch 安装 Open3D-ML 指南
  • 【C++高并发服务器WebServer】-1:Linux中父子进程fork创建及关系、GDB多进程调试
  • C语言数组详解:从基础到进阶的全面解析