scores = cross_val_score(knn, x, y, cv=6, scoring='accuracy') k_error.append(1 - scores.mean()) #画图,x轴为k值,y值为误差值 plt.plot(k_range, k_error) plt.xlabel('Value of K for KNN') plt.ylabel('Error') plt.show()...
data = data[["FFP_DATE", "LOAD_TIME", "FLIGHT_COUNT", "SUM_YR_1", "SUM_YR_2", "SEG...
则进行K-means聚类,如果聚类变量均为定类变量或定量与定类变量混合,则进行K-prototype聚类。本例聚类...
scores=[] #存放轮廓系数for i in range(2,10):Kmeans_model=KMeans(n_clusters=i)predict_=Kmeans_model.fit_predict(data)scores.append( silhouette_score(data,predict_))print("轮廓系数:",scores)#轮廓系数法plt.plot(range(2,10),scores,marker='x')plt.xlabel('Number of clusters')plt.ylabel(...
proba = clf.predict_proba(xv)[:,1] acc.append(np.mean(yhat == yv)) auc.append(roc_auc_score(yv, proba)) acc_mean, acc_std = np.mean(acc), np.std(acc) auc_mean, auc_std = np.mean(auc), np.std(auc)printnameprint'accuracy: {0:.3f} +/- {1:.3f}'.format(acc_mean, ...
mse = mean_squared_error(y_test, y_pred) mse_scores.append(mse) # 输出平均均方误差 print("Average Mean Squared Error:", sum(mse_scores)/len(mse_scores)) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. ...
scores = cross_val_score(knn,train_X,train_y,cv=10,scoring='accuracy') #cv:选择每次测试折数 accuracy:评价指标是准确度,可以省略使用默认值,具体使用参考下面。 cv_scores.append(scores.mean()) plt.plot(k_range,cv_scores) plt.xlabel('K') ...
scores.append(-1*km.score(norm_data)) plt.plot(k_range, scores) plt.xlabel('# of clusters') plt.ylabel('Inertia') sns.despine(offset=5, trim=True)returnscores 开发者ID:lwoloszy,项目名称:albumpitch,代码行数:27,代码来源:genres.py ...
(n_neighbors=k)#cv参数决定数据集划分比例,这里是按照5:1划分训练集和测试集scores = cross_val_score(knn, x, y, cv=6, scoring='accuracy') k_error.append(1- scores.mean())#画图,x轴为k值,y值为误差值plt.plot(k_range, k_error) plt.xlabel('Value of K for KNN') plt.ylabel('Error'...
第二步,每一次挑选其中 1 份作为测试集,剩余 k-1 份作为训练集用于模型训练。 第三步,重复第二步 k 次,这样每个子集都有一次机会作为测试集,其余机会作为训练集。 在每个训练集上训练后得到一个模型, 用这个模型在相应的测试集上测试,计算并保存模型的评估指标, ...