当前位置: 首页 > news >正文

【AI量化模型】跑通baseline

跑通baseline

  • 任务
  • 学习内容
    • 特征工程
    • 模型训练与验证
  • bug
  • 未纠错的结果

任务

教程部署在百度 AI Studio,可以一键fork运行代码,选择*v100 32g1*的配置,baseline运行大约20分钟,再加上进阶部分大约40分钟

学习内容

特征工程

构建基本的时间特征,提取小时、分钟,刻画不同时间阶段可能存在的差异性信息

模型训练与验证

基线实验是采用CatBoost模型,5折交叉验证的方法训练和测试

CatBoost模型不需过程调参,可以得到比较稳定的分数

bug

  1. kf.split(X)
    K折交叉验证是为了得到训练集和验证集的分类索引,这里仅需要对样本进行分类,而不是样本和标签一起

  2. 模型for循环
    交叉验证的结果需要取平均,不应在循环里

未纠错的结果

在这里插入图片描述


  1. 32g 指显存容量,windows版本可通过cmd+dxdiag查看;ubuntu版本可以通过nvidia-smi命令查看,面板中“Memory-Usage”一项表示显存使用率 ↩︎

http://www.lryc.cn/news/112426.html

相关文章:

  • ElasticSearch:全文检索及倒排索引原理
  • blk_mq_alloc_tag_set函数struct blk_mq_tag_set结构体学习
  • Windows搭建Snort环境及使用方式
  • Android network — iptables四表五链
  • 【C++从0到王者】第十六站:stack和queue的使用
  • centos7 部署Tomcat和jpress应用
  • Unity Shader:常用的C#与shader交互的方法
  • luajit 使用 clang编译的坑
  • [SWPUCTF 2021 新生赛]Do_you_know_http
  • web前端之CSS
  • HarmonyOS元服务开发实践:桌面卡片字典
  • xLua学习
  • ​Web3到底是个啥?
  • pycharm、idea、golang等JetBrains其他IDE修改行分隔符(换行符)
  • ThinkPHP函数深度解析
  • 【java】【maven】【高级】MAVEN聚合继承属性等
  • LeetCode150道面试经典题-合并两个有序数组(简单)
  • 记录 运维三剑客一件部署的的docker-compose,yml文件
  • Xposed框架开发
  • 2.13 Android ebpf非网络相关帮助函数API汇总(十二 本章完)
  • 关于游戏的笔记
  • vue diff 前后缀+最长递增子序列算法
  • 【Python】Locust持续优化:InfluxDB与Grafana实现数据持久化与可视化分析
  • 数组模拟循环链表
  • 第三章 图论 No.5最小生成树之虚拟源点,完全图与次小生成树
  • RESTful API的讲解以及用PHP实现RESTful API
  • Spring中@Component和@Bean的区别
  • 【问题解决】mysql 数据库字符串分割之后多行输出方法
  • flutter开发实战-时间显示刚刚几分钟前几小时前
  • 导出LLaMA等LLM模型为onnx