当前位置: 首页 > news >正文

机器学习的工作流程

🌟 欢迎来到AI奇妙世界! 🌟

亲爱的开发者朋友们,大家好!👋

我是人工智能领域的探索者与分享者,很高兴在CSDN与你们相遇!🎉 在这里,我将持续输出AI前沿技术、实战案例、算法解析等内容,希望能和大家一起学习、交流、成长!💡

🔥 为什么关注AI?

人工智能正在重塑世界!🌍

🚀 深度学习让机器拥有“视觉”“听觉”
🤖 **大模型(如GPT、文心一言)**改变人机交互方式
📊 数据科学赋能商业决策
🏥 AI医疗助力精准诊断
🛒 智能推荐优化用户体验
无论你是AI新手👶,还是资深极客👨💻,这里都有适合你的内容!

📌 你将在这里看到什么?

✅ AI基础入门(Python、TensorFlow/PyTorch)
✅ 实战项目(图像识别、NLP、推荐系统)
✅ 论文解读(CVPR、NeurIPS最新研究)
✅ 行业动态(AI政策、大模型进展)
✅ 避坑指南(训练技巧、调参经验)

💬 期待与你互动!

📢 评论区随时交流,欢迎提问!
💌 私信开放,一起探讨技术难题!
🤝 关注我,AI学习路上不迷路!

最后,送上一句AI圈的经典名言:

“人工智能不会取代人类,但会用AI的人会取代不用AI的人。”

让我们一起拥抱AI时代,用代码改变未来!🚀

点击关注👉,开启AI之旅! 🔥🔥🔥

目录

一.什么是机器学习

二.机器学习的工作流程

三.解释上述流程的各步骤

1.获取数据

①获取到的数据种类

②数据中的名词

③数据类型的构成

④数据分割

2.数据基本处理

3.特征工程

①什么是特征工程?

②为什么需要特征工程?

③特征工程包含的内容(了解)

特征提取

特征预处理

特征降维

4.机器学习(模型训练)

5.模型评估

小结


一.什么是机器学习

机器学习是从数据自动分析获得模型,并利用模型对未知数据进行预测。

 简单来说,计算机通过对新的数据进行分析,获得一个模型,通过这个模型,计算机就可以预测未知属性

二.机器学习的工作流程

机器学习工作流程总结: 

  1. 获取数据
  2. 数据基本处理
  3. 特征工程
  4. 机器学习(模型训练)
  5. 模型评估:①结果达到要求,则上线服务 / ②结果没达到要求,则重复上面的步骤

三.解释上述流程的各步骤

1.获取数据

①获取到的数据种类

  • 房屋价格:可能是小数,如105.5万

  • 电影数据:动作片/喜剧片等等

  • 人物分类:可以按是否戴帽子 / 手里是否拿东西等等,来进行分类,没有对错之分,只是分类角度不同

②数据中的名词

在数据集中一般:

  • 一行数据我们称为一个样本

  • 一列数据我们称为一个特征

  • 需要我们判断的列(如上图的电影类型),我们称为目标值
  • 有些数据有目标值,有些数据没有目标值

如下图,有的行就没有电影类型,有的就有。

③数据类型的构成

  • 数据类型一:特征值+目标值(目标值是连续的和离散的)
  • 数据类型二:只有特征值,没有目标值

④数据分割

  • 机器学习一般的数据集会分成两部分
    • 训练数据:用于训练,构建模型
    • 测试数据:在模型检验时使用,用于评估模型是否有效
  • 划分比例:
    • 训练集:70% ~ 80%
    • 测试集:30% ~ 20%

2.数据基本处理

        对数据进行缺失值、去除异常值等处理。

        举例:比如我们让一群人填写问卷调查,肯定有人会有部分项不填写(缺失值),或者年龄填写1000岁(异常值),这两种情况就需要进行处理。

3.特征工程

①什么是特征工程?

        特征工程是使用专业背景知识和技巧,对数据进行处理,使得特征能在机器学习算法上发挥更好的作用

        意义:会直接影响机器学习的效果。

        简单理解就是,进一步对数据进行处理。

        因为工程一般都很重要(比如盖楼工程),所以就表示提取数据的特征是一件很重要的事,因此叫做特征工程。

②为什么需要特征工程?

③特征工程包含的内容(了解)

  • 特征提取

将任意数据(如文本或图像),转换为可用于机器学习的数字特征。

  • 特征预处理

通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

  • 特征降维

指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程。

4.机器学习(模型训练)

单独讲,请见该合集中的【机器学习算法分类介绍】文章。

5.模型评估

单独讲,请见该合集中的【模型评估】文章。

小结

以上就是本篇文章的全部内容,喜欢的话可以留个免费的关注呦~~~

 

http://www.lryc.cn/news/601003.html

相关文章:

  • 【硬件-笔试面试题】硬件/电子工程师,笔试面试题-30,(知识点:传输线特性阻抗,影响因素)
  • Avantage6.6下载与安装教程
  • 瑞吉外卖学习笔记
  • 兼容性问题记录
  • 亚马逊测评采购:如何打造安全的环境,技术基础关键
  • Python点阵字生成与优化:从基础实现到高级渲染技术
  • JavaScript 立即执行函数(IIFE)运行时行为分析笔记
  • golang实现一个规则引擎,功能包括实时增加、修改、删除规则
  • GO 从入门到精通2
  • 什么是缓存雪崩?缓存击穿?缓存穿透?分别如何解决?什么是缓存预热?
  • 编程语言Java——核心技术篇(四)集合类详解
  • 【Pandas】pandas Index objects Index.shape
  • 【595驱动8*8点阵】2022-9-11
  • Linux文件系统管理——NFS服务端的安装配置与NFS客户端的安装与挂载实操教程
  • QT核心————信号槽
  • MyBatis-Plus 进阶功能:分页插件与乐观锁的实战指南
  • org.apache.lucene.search.Query#rewrite(IndexSearcher)过时讲解
  • 框架式3D打印机结构设计cad【9张】三维图+设计说明书
  • Windows Server存储池,虚拟磁盘在系统启动后不自动连接需要手动连接
  • vulhub Earth靶场攻略
  • Java:采用mybatis+pagehealper优雅的实现分页功能
  • 文件操作认识
  • connect系统调用及示例
  • 使用Python实现单词记忆软件
  • 零基础学习性能测试第三章:jmeter性能组件应用(事件,并发,定时器)
  • 大模型 vs 轻量模型:架构与使用场景对比
  • 单片机ADC机理层面详细分析(一)
  • nfls dp 刷题 题解
  • C++平衡二叉搜索树易错点
  • C++ 类型萃取:深入理解与实践