当前位置: 首页 > news >正文

Python28-5 k-means算法

k-means 算法介绍

k-means 算法是一种经典的聚类算法,其目的是将数据集分成 ( k ) 个不同的簇,每个簇内的数据点尽可能接近。算法的基本思想是通过反复迭代优化簇中心的位置,使得每个簇内的点与簇中心的距离之和最小。k-means 算法的具体步骤如下:

  1. 初始化:随机选择 ( k ) 个点作为初始簇中心。

  2. 分配簇:对于数据集中每一个点,计算其到所有簇中心的距离,并将其分配到最近的簇。

  3. 更新中心:重新计算每个簇的中心,即簇内所有点的平均值。

  4. 重复步骤2和3,直到簇中心不再发生变化或达到预设的迭代次数。

代码示例及可视化

以下是一个使用 Python 实现 k-means 算法并进行可视化的示例:

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans# 生成示例数据
np.random.seed(42)
X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)# 运行 k-means 算法
kmeans = KMeans(n_clusters=4)
kmeans.fit(X)
y_kmeans = kmeans.predict(X)# 绘制结果
plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, s=50, cmap='viridis')# 绘制簇中心
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.75)
plt.title('k-means Clustering')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()

运行结果:

图片

代码解释

  1. 数据生成:使用 make_blobs 函数生成300个样本点,分成4个簇,每个簇的标准差为0.60。

  2. k-means 算法:使用 KMeans 类进行聚类,指定聚类数为4。通过 fit 方法对数据进行聚类,并用 predict 方法预测每个样本的簇。

  3. 可视化:使用 Matplotlib 绘制聚类结果。样本点根据其簇类别着色,并用红色标记簇中心。

这个示例展示了如何使用 k-means 算法对数据进行聚类,并通过可视化展示聚类结果和簇中心的位置。

以上内容总结自网络,如有帮助欢迎转发,我们下次再见!

http://www.lryc.cn/news/390330.html

相关文章:

  • 主流国产服务器操作系统技术分析
  • 【Linux】线程封装与互斥(万字)
  • 5分钟教你部署MySQL8.0环境
  • LLM应用:传统NLP任务
  • 基于Hadoop平台的电信客服数据的处理与分析③项目开发:搭建Kafka大数据运算环境---任务11:基础环境准备
  • Golang中swtich中如何强制执行下一个代码块
  • 读书笔记-Java并发编程的艺术-第4章(Java并发编程基础)-第2节(启动和终止线程)
  • 通俗大白话理解Docker
  • 题解:CF1981C(Turtle and an Incomplete Sequence)
  • Swift 中强大的 Key Paths(键路径)机制趣谈(上)
  • (十二)纹理和采样
  • QT创建地理信息shp文件编辑器shp_editor
  • 解析Kotlin中扩展函数与扩展属性【笔记摘要】
  • 【Java学习笔记】java图形界面编程
  • STM32入门笔记(03): ADC(SPL库函数版)(2)
  • 2024年7月2日 (周二) 叶子游戏新闻
  • 如何使用Spring Boot Profiles进行环境配置管理
  • Java错题归纳(二)
  • Grafana面试题精选和参考答案
  • Node版本管理工具 fnm 安装使用
  • vector模拟实现【C++】
  • 《每天5分钟用Flask搭建一个管理系统》第11章:测试与部署
  • Landsat数据从Collection1更改为Collection2
  • 《每天5分钟用Flask搭建一个管理系统》第12章:安全性
  • Unity之创建与导出PDF
  • 【Android面试八股文】优化View层次过深问题,选择哪个布局比较好?
  • 什么是带有 API 网关的代理?
  • sql拉链表
  • STM32CubeMX实现矩阵按键(HAL库实现)
  • mmdetection3D指定版本安装指南