基于Python的K-Means聚类数据分析是怎样的呢-快上网网站建设公司

基于Python的K-Means聚类数据分析是怎样的呢

基于Python的K-Means聚类数据分析是怎样的呢，很多新手对此不是很清楚，为了帮助大家解决这个难题，下面小编将为大家详细讲解，有这方面需求的人可以来学习下，希望你能有所收获。

创新互联公司专注于中大型企业的成都网站设计、成都做网站、外贸网站建设和网站改版、网站营销服务，追求商业策划与数据分析、创意艺术与技术开发的融合，累计客户超过千家，服务满意度达97%。帮助广大客户顺利对接上互联网浪潮，准确优选出符合自己需要的互联网运用，我们将一直专注品牌网站建设和互联网程序开发，在前进的路上，与客户一起成长！

基于Python的K-Means聚类数据分析

在数据挖掘中，K-Means算法是一种 cluster analysis 的算法，其主要是来计算数据聚集的算法，主要通过不断地取离种子点最近均值的算法。

来源于维基百科，自由的百科全书的解释：

k-平均算法源于信号处理中的一种向量量化方法，现在则更多地作为一种聚类分析方法流行于数据挖掘领域。k-平均聚类的目的是：把n个点（可以是样本的一次观察或一个实例）划分到k个聚类中，使得每个点都属于离他最近的均值（此即聚类中心）对应的聚类，以之作为聚类的标准。这个问题将归结为一个把数据空间划分为Voronoi cells的问题。

在数据挖掘中，K-Means算法是一种cluster analysis的算法，其主要是来计算数据聚集的算法，主要通过不断地取离种子点最近均值的算法。

问题

K-Means算法主要解决的问题如下图所示。我们可以看到，在图的左边有一些点，我们用肉眼可以看出来有四个点群，但是我们怎么通过计算机程序找出这几个点群来呢？于是就出现了我们的K-Means算法。基于Python的K-Means聚类数据分析是怎样的呢

算法概要

这个算法其实很简单，如下图所示：

基于Python的K-Means聚类数据分析是怎样的呢

从上图中，我们可以看到，A，B，C，D，E是五个在图中点。而灰色的点是我们的种子点，也就是我们用来找点群的点。有两个种子点，所以K=2。

然后，K-Means的算法如下：

随机在图中取K（这里K=2）个种子点。
然后对图中的所有点求到这K个种子点的距离，假如点Pi离种子点Si最近，那么Pi属于Si点群。（上图中，我们可以看到A，B属于上面的种子点，C，D，E属于下面中部的种子点）
接下来，我们要移动种子点到属于他的“点群”的中心。（见图上的第三步）
然后重复第2）和第3）步，直到，种子点没有移动（我们可以看到图中的第四步上面的种子点聚合了A，B，C，下面的种子点聚合了D，E）。

这个算法很简单，但是有些细节我要提一下，求距离的公式我不说了，大家有初中毕业水平的人都应该知道怎么算的。我重点想说一下"求点群中心的算法"。

求点群中心的算法

一般来说，求点群中心点的算法你可以很简的使用各个点的X/Y坐标的平均值。不过，我这里想告诉大家另三个求中心点的的公式：

1）Minkowski Distance公式——λ可以随意取值，可以是负数，也可以是正数，或是无穷大。

基于Python的K-Means聚类数据分析是怎样的呢

2）Euclidean Distance公式——也就是第一个公式λ=2的情况

3）CityBlock Distance公式——也就是第一个公式λ=1的情况

基于Python的K-Means聚类数据分析是怎样的呢

这三个公式的求中心点有一些不一样的地方，我们看下图（对于第一个λ在0-1之间）。

基于Python的K-Means聚类数据分析是怎样的呢

上面这几个图的大意是他们是怎么个逼近中心的，第一个图以星形的方式，第二个图以同心圆的方式，第三个图以菱形的方式。

看完上述内容是否对您有帮助呢？如果还想对相关知识有进一步的了解或阅读更多相关文章，请关注创新互联行业资讯频道，感谢您对创新互联的支持。

网页题目：基于Python的K-Means聚类数据分析是怎样的呢
本文地址：http://www.cdkjz.cn/article/jcdegj.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

基于Python的K-Means聚类数据分析是怎样的呢

问题

求点群中心的算法

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

基于Python的K-Means聚类数据分析是怎样的呢

问题

求点群中心的算法

相关资讯

服务器安全宣传语句有哪些 服务器安全宣传语句有哪些内容

php实施刷新数据 php刷新自动提交

c语言的函数是可以嵌套吗 c语言的函数可以嵌套定义吗

zblog视频播放插件 zblog插件制作教程

vb点虐 控制软键盘 vb键盘控制对象移动

java佛祖图案代码 代码佛像

阿里云服务器可以更换内网ip 阿里云切换ip

sap系统检验类型的简单介绍

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

服务器安全宣传语句有哪些服务器安全宣传语句有哪些内容

vb点虐控制软键盘 vb键盘控制对象移动

java佛祖图案代码代码佛像

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接