importpandasaspdfromsklearn.clusterimportKMeansimportmatplotlib.pyplotasplt df_features=pd.read_csv(r'C:\预处理后数据.csv',encoding='gbk')# 读入数据'利用SSE选择k'SSE=[]# 存放每次结果的误差平方和forkinrange(1,9):estimator=KMeans(n_clusters=k)# 构造聚类器estimator.fit(df_features[['R','...
选出所有正确的选项。 A、既然K-means算法是无监督学习算法,所以不会过拟合数据,因此聚类的类别越多越好。 B、对于一些数据集来说,“正确的”K值(簇的数量)是不确定的,因此人类专家需要根据数据的特性去确定K值。 C、如果担心K-means陷入局部最优,一个解决这个问题的方法就是尝试使用多个随机的初始化值。 D、...