当前位置: 首页 > news >正文

建立做机器学习项目的范式

建立起做机器学习项目的范式,萃取出核心步骤,避免后面做项目没有明确的方向。

核心步骤:

1、明确自己想做什么样的项目,感兴趣的领域;

2、找到满足项目的数据集,开源的或者自建数据集;

  • 数据集开源,有较多的研究者发表论文和代码;
  • 数据集开源,但是小众,研究者研究较少,论文和开源代码较少;
  • 没有开源数据集,需要自建数据集,满足项目需求;

3、阅读和数据集、项目相关的论文和代码,目的在于提炼出:

  • 特征处理步骤;
  • 算法步骤;
  • 实验方法;

4、根据实验方法进行实验,实现两个目的:

  • 对比不同的方法的指标;
  • 针对实验过程发现的问题,提出改进思路,提高实验指标;

5、将改进思路的核心思想提炼出来,形成创新点成果,发表专利、或者论文等;

项目结构:

在这里插入图片描述

  • config:存放配置文件目录,json文件格式,配置数据、算法模型、实验等;
  • data:存放数据集;
  • data_process:存放读取数据、初步处理数据、数据结构化的代码;
  • example:存放参考的开源代码、相关示例;
  • experiment:存放对比实验、消融实验、改进实验代码;
  • feature_extract:存放提取、处理特征的目录;
  • model:存放机器学习算法、深度学习算法、信号处理算法的目录;
  • out:存放训练的模型文件、实验结果图;
    法、信号处理算法的目录;
  • out:存放训练的模型文件、实验结果图;
  • utils:工具文件,不包含在前面文件夹,但是又是用到的工具文件,例如可视化图结构等;
http://www.lryc.cn/news/20089.html

相关文章:

  • 搭建k8s高可用集群—20230225
  • Java 修饰符和多态
  • 学了一年Java的我,想转嵌入式了
  • 【Git】Git冲突与解决方法
  • 深度剖析数据在内存的存储
  • 身高排序(绝对值大的排后面,小的排前面)
  • 高频前端面试题之HTML篇(三)
  • 使用DG备份恢复测试库的流程以及可能出现的问题
  • Springboot注释解析
  • C语言之通讯录(动态 存储文件版)
  • Linux 工具
  • Java知识复习(七)常见的设计模式(装饰、代理、观察、策略、建造)
  • Linux系统看门狗应用编程
  • Spring MVC 源码- LocaleResolver 组件
  • Servlet
  • 简单的周总结
  • Elasticsearch7.8.0版本进阶——IK中文分词器
  • 一个阿里P6的说不会接口自动化测试,他不会是自己评的吧...
  • 规则引擎与风控系统04:风控系统实例(下)
  • 我为什么选择Linux mint 21.1 “Vera“ ? Mint安装优化调教指南(分辨率DPI)
  • 雅思经验(十四)
  • 刚来的薪资20k,是我的2倍,我是真的卷不过,真的太变态了
  • 五、DeepWalk、Node2Vec论文精读与代码实战【CS224W】(Datawhale组队学习)
  • 学习 Python 之 Pygame 开发魂斗罗(四)
  • Linux 基础知识:指令与shell
  • 【数通网络交换基础梳理1】二层交换机、以太网帧、MAC地址数据帧转发原理详解
  • 《分布式技术原理与算法解析》学习笔记Day22
  • [MySQL]MySQL数据类型
  • 利用steam搬砖信息差赚钱,单账号200+,小白也能轻松上手!
  • 树与二叉树与森林的相关性质