当前位置：首页 > news >正文

Scikit-Learn K均值聚类

news 2025/8/17 4:13:28

Scikit-Learn K均值聚类

- 1、K均值聚类
- - 1.1、K均值聚类及原理
  - 1.2、K均值聚类的优缺点
  - 1.3、聚类与分类的区别
- 2、Scikit-Learn K均值聚类
- - 2.1、Scikit-Learn K均值聚类API
  - 2.2、K均值聚类初体验（寻找最佳K）
  - 2.3、K均值聚类案例

1、K均值聚类

K-均值（K-Means）是一种聚类算法，属于无监督学习。K-Means在机器学习知识结构中的位置如下：

在这里插入图片描述

1.1、K均值聚类及原理

聚类（Clustering）是指将一个数据对象集合划分成簇（子集），使得簇内对象彼此相似，簇间对象不相似。通俗来说，就是将数据划分到不同组中

根据算法原理，常用的聚类算法可分为：基于划分的聚类算法K-Means、基于层次的聚类算法HC、基于密度的聚类算法。本文主要介绍K-Means聚类

K-Means算法起源于1967年，由James MacQueen和J.B.Hartigan提出。K-Means中的K指的是类的数量，Means指均值

K-Means算法的基本原理是：根据样本特征的相似度或距离远近，将样本（N个点）划分成若干个类（K个集群），使得每个点都属于离其最近的中心点（均值）对应的类（集群）

其中，相似度通常使用欧几里得距离来度量，用于计算数据点与质心之间的距离（使用平方）：
$d(X_i,C_j)=||X_i-C_j||^2$

其中， $X_i$ 是数据点， $C_j$ 是质心

K-Means假设一个样本属于一个类，K-Means的类别是样本的中心（均值）；K-Means的损失函数是样本与其所属类的中心之间的距离平方和（SSE）：
$J=\sum_{j=1}^{K}\sum_{i=1}^{N_j}||X_i-C_j||^2$

http://www.lryc.cn/news/334824.html

相关文章：

蓝桥杯 - 受伤的皇后

AcWing---乌龟棋---线性dp

python代码使用过程中使用快捷键注释时报错

go之web框架gin

SpringBoot 定时任务实践、定时任务按指定时间执行

MYSQL数据库故障排除与优化

算法-数论-蓝桥杯

222.完全二叉树节点个数

C++中的string类操作详解

Java绘图坐标体系

【MATLAB源码-第38期】基于OFDM的块状导频和梳状导频误码率性能对比,以及LS/LMMSE两种信道估计方法以及不同调制方式对比。

javaWeb车辆管理系统设计与实现

【DM8】间隔分区

0基础如何进入IT行业？

C#将Console写至文件，且文件固定最大长度

《CSS 知识点》仅在文本有省略号时添加 tip 信息

彩虹聚合DNS管理系统v1.0全新发布

3.10 Python数据类型转换

Kotlin基础学习

配置交换机 SSH 管理和端口安全——实验1:配置交换机基本安全和 SSH管理

海山数据库（He3DB）原理剖析：浅析Doris跨源分析能力

第十三届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组题解

20240324-1-集成学习面试题EnsembleLearning

默克尔（Merkle）树 - 原理及用途

设计模式：迭代器模式

Navicat Premium 16常用快捷键

LeetCode笔记——1042.不邻接植花

Centos7搭建 Skywalking 单机版

定制您的设备体验：如何更改Android启动动画

Docker日常系列