摘要 本发明公开了一种基于并行计算技术的K-means单属性聚类算法处理机,由网络交换机、管理与控制单元、数据预处理单元和并行计算单元组成,所述管理与控制单元、数据预处理单元和并行计算单元之间的数据通信通过网络交换机进行;其工作方法为:将并行计算的数据经数据预处理单元进行预处理,改造后的数据具有适合数据分割...
深入研究了基于云计算平台Hadoop的并行k-means聚类算法,给出了算法设计的方法和策略。在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘。关键词 云计算,Hadoop平台,并行k-means,MapReduce R...
针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高.对Canopy-Kmeans并行聚类算法进行深入的研究,并且在大量不同大小数据集中的实验结果表明,所设计的并行聚类算法具有良好的加速比、数据伸缩率及扩展率等特点,能够在... 查看全部...
摘要 本发明公开了一种基于并行计算技术的K-means单属性聚类算法处理机,由网络交换机、管理与控制单元、数据预处理单元和并行计算单元组成,所述管理与控制单元、数据预处理单元和并行计算单元之间的数据通信通过网络交换机进行;其工作方法为:将并行计算的数据经数据预处理单元进行预处理,改造后的数据具有适合数据分割...