当前位置: 首页 > news >正文

DeepMind的JEST技术:AI训练速度提升13倍,能效增强10倍,引领绿色AI革命

谷歌旗下的人工智能研究实验室DeepMind发布了一项关于人工智能模型训练的新研究成果,声称其新提出的“联合示例选择”(Joint Example Selection,简称JEST)技术能够极大地提高训练速度和能源效率,相比其他方法,性能提高了13倍,而能源效率则提升了10倍。这一进展对于当前担忧人工智能对电力需求激增可能带来的环境压力而言,无疑是一则潜在的好消息。

JEST技术颠覆了传统的AI训练方式,传统方法通常集中于利用单个数据点进行学习,而JEST则基于数据批次进行训练。具体来说,该方法首先构建一个小型AI模型,用于评估来自高质量数据源的数据质量并进行排序。随后,这个小模型会将高质量数据集的评分与一个较大、质量较低的数据集进行对比,挑选出最适合训练的数据批次。接着,大型模型依据小模型的筛选结果进行训练,从而实现更高效的模型学习。

DeepMind的研究人员强调,JEST成功的关键在于其引导数据选择过程朝向较小且精心策划的数据集分布的能力。实验结果显示,该方法相较于最前沿的模型,如SigLIP,在迭代次数和计算量上分别减少了最多13倍和10倍,显著提升了效率和速度。

然而,JEST方法的成功高度依赖于训练数据的质量。这种方法要求有一个由专家精心策划的高质量初始数据集作为基础,否则“垃圾进,垃圾出”的原则将严重影响其效果。这意味着对于业余爱好者或非专业AI开发者来说,要实现JEST的高效训练将面临更多挑战,因为它需要高级别的研究技能来准备数据集。

在当前背景下,JEST技术的出现正当其时。随着科技行业和各国政府开始讨论人工智能日益增长的巨大能源消耗问题,这一研究显得尤为重要。据统计,2023年AI工作负载消耗了大约4.3GW的电力,几乎相当于塞浦路斯一年的用电量。而未来发展趋势显示,AI能源需求将持续上升,例如单次ChatGPT请求的能耗是谷歌搜索的10倍,Arm公司CEO预测到2030年,AI将占据美国电网四分之一的电力。

至于JEST技术是否会被AI领域的大型企业采纳,以及如何采纳,目前尚待观察。考虑到训练大型模型如GPT-4的成本已高达1亿美元,未来规模更大的模型训练成本或将突破十亿美元大关,因此企业迫切需要寻找节省成本的方法。乐观人士希望JEST技术能够帮助维持现有的训练效率,同时大幅降低能耗,减轻AI成本并有利于环境保护。然而,现实可能是资本驱动下,企业利用JEST技术维持高能耗下的超高速训练产出,成本节约与产出规模之间的平衡将是一个复杂博弈。

http://www.lryc.cn/news/395365.html

相关文章:

  • 如何使用 pytorch 创建一个神经网络
  • Java版Flink使用指南——定制RabbitMQ数据源的序列化器
  • CV每日论文--2024.7.8
  • 【AI大模型】赋能儿童安全:楼层与室内定位实践与未来发展
  • 云服务器linux系统安装配置docker
  • 泰勒雷达图2
  • 数据库容灾 | MySQL MGR与阿里云PolarDB-X Paxos的深度对比
  • react根据后端返回数据动态添加路由
  • 机器学习中的可解释性
  • 上海慕尼黑电子展开展,启明智显携物联网前沿方案亮相
  • Centos7离线安装ElasticSearch7.4.2
  • 深入理解sklearn中的模型参数优化技术
  • 【Elasticsearch】开源搜索技术的演进与选择:Elasticsearch 与 OpenSearch
  • 欧拉openEuler 22.03 LTS-部署k8sv1.03.1
  • 老年生活照护实训室:为养老服务业输送专业人才
  • go语言中使用WaitGroup和channel实现处理多线程问题
  • Open3D 计算点云的平均密度
  • C语言之数据在内存中的存储(1),整形与大小端字节序
  • B端全局导航:左侧还是顶部?不是随随便便,有依据在。
  • 什么是海外仓管理自动化?策略及落地实施步骤指南
  • 自定义控件三部曲之绘图篇(六)Paint之函数大汇总、ColorMatrix与滤镜效果、setColorFilter
  • 请写sql满足业务:找到连续登录3天以上的用户
  • fatal error: apriltag/apriltag.h: No such file or directory 的 参考解决方法
  • C++继承(一文说懂)
  • 卷积神经网络可视化的探索
  • RxJava学习记录
  • Spring Boot Vue 毕设系统讲解 3
  • Spring Boot对接大模型:实战价值与技巧
  • 完美解决NameError: name ‘file‘ is not defined的正确解决方法,亲测有效!!!
  • Witness Table 的由来