当前位置: 首页 > news >正文

(一)机器学习 - 入门

数据集

数据集是一组数据的集合,这些数据可以是数值型、文本型、图形型等多种形式。数据集通常用于统计分析、机器学习、科学研究、商业智能等领域,以发现数据中的模式、趋势和关联性。

数据集的组成:

  • 变量(Variables):数据集中的每个数据项称为变量,它们可以是数值、文本或日期等类型。
  • 观测值(Observations):数据集中的每一行或记录称为观测值,代表一个独立的数据点。
  • 特征(Features):在机器学习中,数据集中的每个变量或属性称为特征。
  • 实例(Instances):在某些情况下,观测值也被称为实例。

一个数组的例子:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

一个数据库的例子:

CarnameColorAgeSpeedAutoPass
BMWred599Y
Volvoblack786Y
VWgray887N
VWwhite788Y
Fordwhite2111Y
VWwhite1786Y
Teslared2103Y
BMWblack987Y

数据类型

主要三种类别:

  • 数值(Numerical)
  • 分类(Categorical)
  • 序数(Ordinal)

数值数据是数字,可以分为两种数值类别

离散数据(Discrete Data)

- 限制为整数的数字。例如:经过的汽车数量。

连续数据(Continuous Data)

- 具有无限值的数字。例如:一件商品的价格或一件商品的大小。

分类数据是无法相互度量的值。例如:颜色值或任何 yes/no 值。

序数数据类似于分类数据,但可以相互度量。示例:A 优于 B 的学校成绩,依此类推。

通过了解数据源的数据类型,您就能够知道在分析数据时使用何种技术。

END.

http://www.lryc.cn/news/503595.html

相关文章:

  • 【解决】k8s使用kubeadm初始化集群失败问题整理
  • apache-dubbo
  • ECharts柱状图-柱图2,附视频讲解与代码下载
  • 【新人系列】Python 入门(十六):正则表达式
  • HTML综合
  • 孚盟云 MailAjax.ashx SQL注入漏洞复现
  • 解决“VMware虚拟机报Intel VT-x”错误
  • NiceGUI `ui.table` 基础
  • 分布式 Raft算法 总结
  • C++ 中面向对象编程如何实现动态绑定?
  • 微服务-01
  • 这是一个vue3 + scss的数字滚动效果
  • 数字证书管理工具 openssl keytool
  • Polars数据聚合与旋转实战教程
  • 引用类型集合的深拷贝,无需手动写循环:Apache Commons Lang (SerializationUtils)
  • HTML、CSS表格的斜表头样式设置title 画对角线
  • docker 安装mysql 5.7 详细保姆级教程
  • Kioptrix level3
  • UE5 Lyra项目源码分析-关卡配置加载
  • Cursor重置机器码-解决Too many free trials.
  • transformer学习笔记-自注意力机制(2)
  • 呼叫中心呼入大模型如何对接传统呼叫中心系统?
  • [Unity] Text文本首行缩进两个字符
  • 最新版Chrome浏览器加载ActiveX控件之Adobe PDF阅读器控件
  • springboot 对接 ollama
  • 【数据库】选择题+填空+简答
  • 从0开始写android 之xwindow
  • The Past, Present and Future of Apache Flink
  • 多模块应用、发布使用第三方库(持续更新中)
  • An error happened while trying to locate the file on the Hub and we cannot f