当前位置: 首页 > news >正文

机器学习--K-Means

K均值聚类

算法过程

K − m e a n s K-means Kmeans 是 聚类 c l u s t e r i n g clustering clustering 算法的一种,就是给你一坨东西,让你给他们分类:

在这里插入图片描述

  我们的 K − m e a n s K-means Kmeans 大概是这样一个流程:

  1. 第一步随机生成两个点(因为这里我想分两类,你想分几类你就弄几个点),标记为两个聚类中心 c l u s t e r c e n t r i o d cluster \; centriod clustercentriod,像这样:

在这里插入图片描述

  1. 然后重复以下两个步骤:

   1. 遍历每个点 x ( i ) x^{(i)} x(i),分别计算点 x ( i ) x^{(i)} x(i) 到两个聚类中心的距离 d 1 d_1 d1 d 2 d_2 d2,然后比较大小。并标记这个点为距离更小的那一类

   2. 分别遍历同一类的所有点,计算这些点的几何平均位置,并把聚类中心移动到这个位置

  这样说起来可能很抽象,我们还是用图像来更清晰的表示一下这个过程:

在这里插入图片描述

  图画到这里我们就能明显的观察到两个聚类已经被划分好了。

优化目标函数

  像前面介绍的线性回归、逻辑回归、 S V M SVM SVM 一样,这里的 K − m e a n s K-means Kmeans 也有一个用于优化的函数:

n o t a t i o n notation notation c i c_i ci 表示点 x i x_i xi 的类别, μ k \mu_k μk 表示聚类中心 k k k μ c i \mu_{c_i} μci 表示 x i x_i xi 所属的那个聚类中心

J ( c 1 , ⋯ , c m , μ 1 , ⋯ , μ K ) = 1 m ∑ i = 1 m ∣ x i − μ c i ∣ 2 J(c_1, \cdots, c_m, \mu_1, \cdots, \mu_K) = \frac{1}{m}\sum_{i = 1}^m |x_i - \mu_{c_i}|^2 J(c1,,cm,μ1,,μK)=m1i=1mxiμci2

  我们要做的就是:

min ⁡ c , μ J ( c 1 , ⋯ , c m , μ 1 , ⋯ , μ K ) \min\limits_{c, \mu} J(c_1, \cdots, c_m, \mu_1, \cdots, \mu_K) c,μminJ(c1,,cm,μ1,,μK)

  看得出来,这就是要最小化所有点 x i x_i xi 与其所属的聚类中心 μ x i \mu_{x_i} μxi 的距离的平方和。

114514 114514 114514 k − m e a n s k-means kmeans

  可能你也注意到了,我们如果只跑一遍 k − m e a n s k-means kmeans 的话可能不会得到一个很好的分类方案,所以我们考虑每次随机初始化聚类中心,然后跑很多遍(取决于你的数据规模和时间) k − m e a n s k-means kmeans,对于每次计算出来的 c , μ c, \mu c,μ 算出它的 J ( c , μ ) J(c, \mu) J(c,μ),然后在其中选择 J ( c , μ ) J(c, \mu) J(c,μ) 最小的那个分类方案作为最后的答案。

http://www.lryc.cn/news/441485.html

相关文章:

  • 模型训练时CPU和GPU大幅度波动——可能是数据的读入拖后腿
  • keep-alive的应用场景
  • 【C++ Primer Plus习题】16.9
  • Java入门:09.Java中三大特性(封装、继承、多态)02
  • AI为云游戏带来的革新及解决方案:深度技术剖析与未来展望
  • 集合是什么
  • JavaDS —— 图
  • 魅思-视频管理系统 getOrderStatus SQL注入漏洞复现
  • SOME/IP通信协议在汽车业务具体示例
  • jupyter notebook添加环境/添加内核
  • 建模杂谈系列256 规则函数化改造
  • python实现冒泡排序的算法
  • 爱玩游戏的弟弟,被人投资了100万
  • Pandas_数据结构详解
  • Leetcode 3287. Find the Maximum Sequence Value of Array
  • python 山峦图
  • Open3D:3D数据处理与可视化的强大工具
  • YOLOv8改进系列,YOLOv8的Neck替换成AFPN(CVPR 2023)
  • BitLocker硬盘加密的详细教程分享
  • YOLOv8的GPU环境搭建方法
  • JZ2440下载后设置NAND启动文件系统
  • AI绘画与摄影新纪元:ChatGPT+Midjourney+文心一格 共绘梦幻世界
  • 金手指设计
  • Chainlit集成LlamaIndex并使用通义千问模型实现AI知识库检索网页对话应用增强版
  • 详解c++菱形继承和多态---下
  • python学习笔记目录
  • 非结构化数据中台架构设计最佳实践
  • 鹏鼎控股社招校招入职SHL综合能力测评:高分攻略及真题题库解析答疑
  • 【测向定位】差频MUSIC算法DOA估计【附MATLAB代码】
  • 智能车镜头组入门(四)元素识别