当前位置: 首页 > news >正文

英伟达发布RAPIDS cuDF框架 pandas在GPU上运行速度快了150倍

11月9日 消息:Nvidia 发布了一款名为 RAPIDS cuDF 的新版本,据称可以将 pandas 运行在 GPU 上,并且性能提升了150倍。pandas 是一款流行的基于 Python 的数据框架库,用于数据处理和分析。它的开源版本由 Wes McKinney 开发和发布,全球约有950万开发者使用。新版本的 RAPIDS cuDF 是基于 Apache Arrow 构建的 Python GPU dataframe 库,提供了类似 pandas 的 API,可以加载、过滤和操作数据。

图片

之前使用 cuDF 时,存在一些限制,导致一些 pandas 功能无法受益于 GPU 加速计算。此外,需要为 GPU 和 CPU 执行设计不同的代码路径,并且在与其他 PyData 库交互时需要手动切换 cuDF 和 pandas。新版本的 RAPIDS cuDF 解决了这些问题,提供了统一的 CPU/GPU 体验,使得 pandas 代码可以在 GPU 加速环境下运行而不需要修改。

Nvidia 表示,他们使用 DuckDB 的 H2O.ai 的 Database-like Ops Benchmark 对性能提升进行了基准测试。测试中使用了一个5GB 的数据集,包含了一个连接操作和一个高级分组操作。在 CPU 上运行的 pandas 平均需要约5分7秒来执行这两个任务,而在使用 RAPIDS cuDF 加速的 pandas 上平均只需要约1.5秒。

GPU 加速的 pandas 现在已经作为 beta 版在开源的 RAPIDS 版本23.10中提供。Nvidia 表示,它将很快加入到 Nvidia AI Enterprise 中。这个新功能对于想要继续使用 pandas 进行大型数据处理的数据科学家来说非常有用,因为随着数据规模的增长,pandas 的性能会下降,而使用 GPU 加速可以获得更好的性能。

Nvidia 发布的新版本的 RAPIDS cuDF 框架为数据科学家提供了一个性能更高的选择。通过将 pandas 运行在 GPU 上,可以获得最高150倍的性能提升。这对于处理大规模数据的任务非常有用,使得数据科学家可以更高效地进行数据处理和分析。

图片

http://www.lryc.cn/news/223486.html

相关文章:

  • (a)Mask RCNN总体流程
  • 浅谈数据中心机房末端配电技术与产品监控选型-安科瑞黄安南
  • 红包算法 java实现
  • MVCC中的可见性算法
  • Leetcode73矩阵置零
  • linux重要的目录之proc和dev目录
  • 【组件自定义事件+全局事件总线+消息订阅与发布+TodoList案例——编辑+过度与动画】
  • 单独封装export default .js 在引入
  • 【带头学C++】----- 三、指针章 ---- 3.11 补充重要指针知识(二,拓展基础知识)
  • Jmeter分布式性能测试细节+常见问题解决,资深老鸟带你避坑...
  • 动态表单获取某一项值
  • 短路表达式
  • 风力发电场集中监控系统解决方案
  • SpringDataJpa(二)
  • 软件测评中心▏软件功能测试和非功能测试的区别和联系简析
  • 打卡系统有什么用?如何通过日常管理系统提高企业员工的效率?
  • png怎么转jpg?这款图片转格式工具一学就会用
  • 万界星空科技MES系统软件体系架构及应用
  • uniapp h5实现Excel、Word、PDF文件在线预览,而不是跳转下载,也不需要下载
  • 台式电脑一键重装Win10系统详细教程
  • 图像相机-相机属性SDK汇总设置
  • 使用ffmpeg调用电脑自带的摄像头和扬声器录制音视频
  • 工业物联网模块应用之砂芯库桁架机器人远程无线控制
  • Ubuntu安装.Net SDK
  • 相交链表~
  • 跨境电商API接口如何通过API数据接口进行选品
  • ArrayList集合方法(自写)
  • sql注入学习笔记
  • 企业涉密文件怎么加密?企业重要文件加密方法
  • 经典猜数游戏(python类封装)