k-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。
首先从n个数据对象任意选择k个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数.k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。
K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。KNN方法虽然从原理上也依赖于极限定理,但在类别决策时,只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。
KNN算法不仅可以用于分类,还可以用于回归。通过找出一个样本的k个最近邻居,将这些邻居的属性的平均值赋给该样本,就可以得到该样本的属性。更有用的方法是将不同距离的邻居对该样本产生的影响给予不同的权值(weight),如权值与距离成正比。
PS:注意粗体字两个k的含义不同的
相关推荐
基于分块后重叠K-means聚类的KNN分类算法.pdf
用k-means算法实现KNN算法,是模式识别中的经典算法再现
K-means原理分析与算法实现,对给出的一些数据点能够实现K-means聚类并可视化
个性化服务中的并行K-Means聚类算法 Knn :K-Means A类算法在墓于Web日志的个性化服务领域得到广泛的应用,但是在处理海I戮据过程中, 传统的(单机)K-Means聚类算法存在着可扩展性差、效率低下、运行时间长等缺点,在...
课程大作业-基于K-means聚类算法和KNN决策判别器的国家经济实力评价matlab源码+数据+报告.zip 第二章 基于K-means的分类统计 5 2.1 K-means介绍 5 2.2 K-means聚类在分类国家经济实力中的应用 7 第三章 基于KNN的...
K-means分类算法 K-means源代码 推荐算法概述 回归分析 神经网络基础模型 BP神经网络(Back Propagatioon) 目录 人工智能基本概念 KNN分类算法 K-NN源代码 K-means分类算法 K-means源代码 推荐算法概述 回归分析 ...
Python2.X 如有侵权,请联系我删除
实现KNN算法和K-means算法,的详细过程。
文章目录一、原理和流程1、原理2、流程二、K-means中常用的...1、简述一下K-means算法的原理和工作流程 2、K-means中常用的到中心距离的度量有哪些? 3、K-means中的k值如何选取? 4、K-means算法中初始点的选择对最终结
matlab写成的K_means算法,经典简单,注释明确,适合初学者,其中还附带了EM算法
Python实现线性回归、逻辑回归、KNN、SVM、朴素贝叶斯、决策树、K-Means7种机器学习算法的经典案例——亲测可用
It s the kNN or else named k-Nearest Neabours algorythm, realized by the tools of Visual Studio developer system.
文档鸢尾花的散点图(matlab绘制)-K近邻(KNN)分类,K-Means聚类算法聚类提取方式是百度网盘分享地址
K means算法 与 KNN算法.doc
Sklearn机器学习中的主要算法原理以及实现(线性回归、逻辑回归、朴素贝叶斯、K-Means聚类、KNN等等).zip
Sklearn机器学习中的主要算法原理以及实现(线性回归、逻辑回归、朴素贝叶斯、K-Means聚类、KNN、PCA主
Sklearn机器学习中的主要算法原理以及实现(线性回归、逻辑回归、朴素贝叶斯、K-Means聚类、KNN、PCA主成分分析
K近邻(KNN):分类算法KNN是non-parametric分类器(不做分布形式的假设,直接从数据估计概率密度),是memory-based learning KNN不适用于高维数据(curse of dimension)
数据挖掘经典算法 论文文献,C4.5,k-Means, SVM, Apriori, EM, PageRank, AdaBoost,kNN, Naive Bayes, and CART