K均值聚类
根据到给点样本的距离,来聚类。
1.曼哈顿距离、
2.欧几里得距离
直线距离
3.切比雪夫距离
4.闵氏距离
5.余弦相似度
对数据大小/长度等不关注,只关注相似度。
6.汉明距离 二进制距离
二、密度聚类 DBSCAN
前提是样本是根据紧密程度分布的。
先用超参数生成核心对象
三、层次聚类
合并距离最近的两个样本点。关键是求距离。
四、高斯混合分布聚类:数据重合,均值或方差至少有一个是不同的。
五、总结
六、性能度量
1.利用真实值
2.不利用外部真实值