1、k-means聚类算法简介
k-means算法把数据集分成k个组,使每个组内具有较高的相似度。其处理过程如下:
1、随机选择k个点作为初始的聚类中心
2、对于剩下的点,根据其与聚类中心的距离,将其归入最近的组
3、对每个组,计算所有点的均值作为新的聚类中心
2、数据源
1999年全国31个省份城镇居民家庭平均每人全年消费性支出的八个主要变量数据,这八个变量分别是:食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住以及杂项商品和服务。
下载地址:链接:https://pan.baidu.com/s/1ClND-R7rpx8M03TirkqXLw 密码:6tk6
3、实验目的
通过聚类,了解1999年各个省份在国内的消费水平情况
4、代码实例
1 | import numpy as np |
5、运行结果
1 | 每人每年的消费:¥5113.54 |