当前位置: 首页 > news >正文

kaggle新赛:谷歌AI模型运行时间预测赛题解析【数据挖掘】

赛题名称:Google - Fast or Slow? Predict AI Model Runtime

赛题链接:https://www.kaggle.com/competitions/predict-ai-model-runtime

赛题背景

Alice 是一名 AI 模型开发人员,但她的团队开发的一些模型运行速度非常慢。她最近发现了编译器的配置,这些配置改变了编译器编译和优化模型的方式,从而使模型运行得更快(或更慢)。参赛者的任务是帮助 Alice 找到每个模型的最佳配置。

赛题方向

数据挖掘

赛题任务

根据训练数据集中提供给参赛者的运行时数据训练机器学习模型,并进一步预测测试数据集中图形和配置的运行时。

数据描述

我们的数据集称为TpuGraphs,这是在XLA HLO图上运行在张量处理单元(TPUs) v3上的性能预测数据集。

总共有5个数据集集合:layout:xla:randomlayout:xla:defaultlayout:nlp:randomlayout:nlp:defaulttile:xla

最终得分将是所有数据集的平均值。要下载整个数据集并查看更多信息,参赛者可以导航到数据选项卡。

基准模型

我们在https://github.com/google-research-datasets/tpu_graphs上提供了基准模型和训练设置。请参阅我们的数据集论文(https://arxiv.org/abs/2308.13490),了解基准模型的详细信息。

评价指标

根据实际需求,我们使用两种评估指标,并对其取平均。

具体来说,对于数据集“tile:xla”,我们使用top-K预测产生的“(1-slowdown)”来反映模型预测的top-K配置相对于实际最快配置的速度降低情况,计算如下:

其中 K 是top-K预测,A 是数据集中给定图的所有配置,y 是测量的执行时间。

对于 layout:* 数据集,我们使用肯德尔秩相关系数(一种排名评估指标:模型预测的配置排序与运行时间排序的实际对应程度)。

提交文件

参赛者的提交文件必须是一个带有标题ID、TopConfigscsv文件。每个npz/**/test/*.npz文件(请参阅数据)在csv文件中必须有一行。

  • ID是{collection}:{test_filename_without_extension},其中collection是tile:xla、layout:xla:random、layout:xla:default、layout:nlp:random和layout:nlp:default之一。

  • TopConfigs应该根据参赛者的模型预测,按照从最快(运行时间最短)到最慢(运行时间最长)的顺序,用“;”分隔列出配置的索引。

    • 对于集合tile:xla,只有前5个条目将被考虑,其余的将被忽略。

    • 对于layout:*集合,所有条目将被考虑

  • 有关样本提交文件,请从数据选项卡下载sample_submission.csv。

时间安排

  • 2023年8月29日 - 开始日期。

  • 2023年11月10日 - 报名截止日期。

  • 2023年11月17日 - 最终提交截止日期。

赛题奖金

  • 第一名 - 15,000美元

  • 第二名 - 10,000美元

  • 第三名 - 8,000美元

  • 第四名 - 7,000美元

  • 第五名 - 5,000美元

  • 第六名 - 5,000美元

关注下方【学姐带你玩AI】🚀🚀🚀

回复“比赛”获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

http://www.lryc.cn/news/149223.html

相关文章:

  • mysql性能测试工具选择 mysql软件测试
  • GPS全球卫星定位系统原理
  • Ubuntu学习---跟着绍发学linux课程记录(第一部分)
  • Ubuntu20.04下安装google输入法
  • Ros noetic 机器人坐标记录运动路径和发布 实战教程(A)
  • Java“牵手”1688淘口令转换API接口数据,1688API接口申请指南
  • Python实现自动关键词提取
  • java八股文面试[多线程]——sleep wait join yield
  • Vue/React 项目部署到服务器后,刷新页面出现404报错
  • 通信笔记:RSRP、RSRQ、RSNNR
  • 前端:html实现页面切换、顶部标签栏(可删、可切换,点击左侧超链接出现标签栏)
  • python print格式化输出
  • 钢筋水泥中的信仰--爱摸鱼的美工(16)
  • ViT论文Pytorch代码解读
  • Harbor查看密码
  • Boa服务器与Cgi简介
  • 入门vue——创建vue脚手架项目 以及 用tomcat和nginx分别部署vue项目(vue2)
  • oracle中的(+)
  • 五种永久免费 内网穿透傻瓜式使用
  • 【Java基础增强】Stream流
  • reduxreact-redux
  • go中的并发
  • 开启EMQX的SSL模式及SSL证书生成流程
  • 4 | Java Spark实现 WordCount
  • Redis7安装
  • Nginx vs Tomcat:一个高性能Web服务器和Java应用服务器的对决
  • 终端登录github两种方式
  • 【防火墙】防火墙NAT Server的配置
  • 《算法竞赛·快冲300题》每日一题:“简化农场”
  • 【二等奖方案】大规模金融图数据中异常风险行为模式挖掘赛题「冀科数字」解题思路