A.正确 B.错误 点击查看答案
本文研究基于hadoop的k-means聚类算法和TFIDF算法,分别实现及优化这两种算法并在单机状况及集群状况下进行试验。本文实现并行化的K-means算法和TFIDF算法并针对传统K-means算法的存在的一个问题进行优化,即初始聚类划分对算法执行时间有很大影响,本文将传统算法的随机选择初始聚类划分的方法进行改进,进行两种改进,分别为...