2]df_UB=df[:,3]# ic(df_LB, df_UB)# ic(df_LB.shape, df_UB.shape)# 在LB和UB区间内生成均匀的100个数据,然后再用borderline-SMOTE进行虚拟样本生成Initial_dt=np.array(gene_data(df_LB,df_UB))X=Initial_dt.T
随后对不平衡数据进行过采样处理,对比模型评价结果,Borderline-SMOTE处理后的数据集模型评分最高.将平衡数据集代入分类模型,XGBoost和随机森林的分类效果位居一,二,重点对这两种方法展开模型优化,优化后准确度均有显著上升.通过应用上述机器学习算法进行脑卒中预测模型研究,不断提高模型预测的精度,对医学临床预测脑卒中及...