Python利用sklearn进行kmeans聚类

sklearn是机器学习领域中最知名的python模块之一。sklearn的官网链接http://scikit-learn.org/stable/index.html#

kmeans算法概述:

k-means算法概述

MATLAB kmeans算法:

MATLAB工具箱k-means算法

下面利用python中sklearn模块进行数据的聚类

数据集自制数据集

维度为3。

需要用到的python库:

  • xlrd:读取Excel中的数据
  • pandas:数据处理
  • numpy:数组
  • sklearn:聚类

代码

结果:

[[ 5. 1. 0. 0.]
[ 48. 1. 3. 2.]
[ 20. 0. 3. 0.]
[ 69. 1. 4. 1.]
[ 88. 1. 2. 1.]
[ 14. 0. 2. 0.]
[ 32. 0. 4. 2.]
[ 39. 0. 4. 2.]
[ 50. 1. 1. 2.]
[ 9. 0. 0. 0.]]

一共聚类成3类,最后一列是类别数(0,1,2)

一条评论

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注