当前位置: 首页 > news >正文

DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?

嘿,技术小伙伴们!今天咱们聊聊最近在AI界引发轰动的新闻——DeepSeek和xAI相继用R1和Grok-3证明了预训练Scaling Law并非OpenAI的护城河。这意味着什么呢?让我们一探究竟!

开场白

首先,让我们看看最新的“全能冠军”——Grok 3。这款被誉为“地球上最聪明的AI”的模型不仅证明了Scaling Law的有效性,还进一步攻破了OpenAI的技术壁垒。😱

深度探讨:Scaling Law vs. 推理能力

在此之前,DeepSeek已经证明无需依赖Scaling Law也能达到OpenAI o1的水平。这就像是“一根筋,两头堵”,无论Scaling Law是否有效,OpenAI的技术优势似乎都在逐渐消失。

经济学家Ethan Mollick认为:AI确实进入了新时代,OpenAI的时代正在落幕。这不禁让人质疑,OpenAI的未来还能否持续领先?

数据的重要性

一个关键点是,谷歌和xAI拥有独特且有价值的数据源,这些数据源使它们逐渐区别于其他竞争对手。如果没有访问YouTube、X、TeslaVision、Instagram和Facebook等独有数据,未来的尖端模型可能不会有投资回报(ROI)。

OpenAI面临的挑战

从2022年夏季到2024年春季,OpenAI凭借GPT-4领先市场,但随着谷歌和Anthropic的追赶,这种领先地位已不再明显。如今,DeepSeek、谷歌和xAI与OpenAI大致处于同一水平,其中xAI甚至稍占优势。

微软CEO纳德拉也公开表示,在模型能力上,OpenAI曾经拥有的独特优势即将结束。而微软也不再为OpenAI投入大量资金进行预训练,转而支持推理服务以盈利。

内忧外患:人才流失与外部压力

除了外部的竞争压力,OpenAI内部也面临着巨大的挑战。前CTO Mira Murati、首席科学家Ilya Sutskever、创始员工Andrej Karpathy以及副总裁Dario Amodei等重要人物纷纷离职,创立了自己的公司或实验室。这对OpenAI来说无疑是个沉重的打击。😢

AI的收入来源:推理而非训练

有趣的是,AI的收入主要来自推理,而非训练。如果Scaling Law仍然有效,那么只有少数几家公司会进行尖端模型的预训练。其余的AI计算将集中在一些较小的数据中心,这些数据中心经过地理优化,实现了低延迟和高成本效益的推理。

Gavin S. Baker指出:“经济高效的推理 = 更便宜、质量较低的电力”。随着时间的推移,推理所需的计算量将大大增加,而预训练的比例将减少至5%,推理则占95%。

DeepSeek效应:开源与创新

即便是DeepSeek梁文峰也公开表示,业内对DeepSeek-R1的反应有些过度。他认为这只是普通的创新,世界每天都有类似的进展。然而,DeepSeek的确在大模型训练上取得了一些创新,并且与其他从业人员一样研究同样的问题。

更令人兴奋的是,他们在开源AI界引发了用最经济的方法复刻DeepSeek-R1“顿悟时刻”的竞赛。这一切就像是2004年的谷歌,通过分布式算法和开源论文推动了整个行业的发展。

结语

总的来说,这场AI界的较量远未结束。尽管OpenAI面临诸多挑战,但AI领域每周都会有新的突破和发展。每个人都会在几个月内复制这一成就,一切都会变得更便宜。

唯一的真正后果是,AI乌托邦/末日现在比以往任何时候都要近。时间会证明一切,让我们拭目以待吧!

如果你对这篇文章感兴趣,或者有不同的见解,欢迎在评论区留言分享你的想法哦!😊

http://www.lryc.cn/news/545722.html

相关文章:

  • 【知识】torchrun 与 torch.multiprocessing.spawn 的对比
  • 深入了解 K-Means 聚类算法:原理与应用
  • Rust ~ Collect
  • C# 类型转换
  • [IP] DDR_FIFO(DDR3 用户FIFO接口)
  • 第三百七十二节 JavaFX教程 - JavaFX HTMLEditor
  • 蓝桥杯试题:DFS回溯
  • Lua | 每日一练 (4)
  • 每日一题——接雨水
  • java常见面试01
  • 算法-二叉树篇27-把二叉搜索树转换为累加树
  • C语言:51单片机 基础知识
  • olmOCR:使用VLM解析PDF
  • 数据结构(初阶)(七)----树和二叉树(堆,堆排序)
  • 图像分类项目1:基于卷积神经网络的动物图像分类
  • Kali Linux 2024.4版本全局代理(wide Proxy)配置,适用于浏览器、命令行
  • [Windows] 批量为视频或者音频生成字幕 video subtitle master 1.5.2
  • 不要升级,Flutter Debug 在 iOS 18.4 beta 无法运行,提示 mprotect failed: Permission denied
  • 介绍 torch-mlir 从 pytorch 生态到 mlir 生态
  • upload
  • InterHand26M(handposeX-json 格式)数据集-release >> DataBall
  • [Java基础] JVM常量池介绍(BeanUtils.copyProperties(source, target)中的属性值引用的是同一个对象吗)
  • `maturin`是什么:matu rus in python
  • spring boot整合flyway实现数据的动态维护
  • unity中使用spine详解
  • 14. LangChain项目实战1——基于公司制度RAG回答机器人
  • 利用STM32TIM自制延迟函数实验
  • 创建一个MCP服务器,并在Cline中使用,增强自定义功能。
  • Android Activity栈关系解析
  • java使用word模板填充内容,再生成pdf