它是非监督学习中一种聚类算法,换句话说:喂给该算法模型都是无label的数据,杂乱无章的。 为了方便理解,我也同样构造了Kmeans数据集: 该数据的电影类型都未知,即该数据label都未知,我们需要通过Kmeans算法得出他们label。 1.3 KNN和Kmeans总结 两种算法之间的根本区别是: KNN属于监督学习,类别是已知的,通过对已知...
K-Means是无监督学习的聚类算法,没有样本输出; KNN是监督学习的分类算法,有对应的类别输出。 是否需要训练 K-Means则有明显的训练过程,找到k个类别的最佳质心,从而决定样本的簇类别。 KNN基本不需要训练,对测试集里面的点,只需要找到在训练集中最近的k个点,用这最近的k个点的类别来决定测试点的类别。 相似点:...
1. 算法介绍KNN是监督学习中的分类工具,通过已知分类的数据进行训练。例如,给定电影数据集,KNN可以帮助我们预测未知电影的类型。KMeans则属于非监督学习,用于无标签数据的聚类,如将电影按照类型自动划分。2. 算法思想2.1 KNNKNN原理:通过计算预测点与所有点的距离,选择K个最近的样本,按类别频率决定...