该模型首先利用过采样技术SMOTE算法对原始数据进行处理,减小不平衡数据对模型的影响;接着利用深度神经网络实现航班延误等级预测.此外,本文将所提模型用于真实数据的航班延误预测.结果表明,对航班延误失衡数据进行平衡处理后可以提高模型的拟合度和预测精度,SMOTE-DNN的预测精度可以达到88.79%,且对航班延误各等级均有着较好...
本发明提供了一种基于EasyEnsemble算法和SMOTE算法的极度不均衡数据分类方法.主要步骤为:先用SMOTE算法构造多个少数类子集,增加少数类样本;然后对多数类进行随机欠采样,合并各多数类子集和少数类子集,获得多个样本比例一定的训练子集;再对每个训练子集进行降噪处理;然后分别用降噪后的训练子集训练一个AdaBoost分类器;最后集...
目的分析初产妇发生盆底功能障碍的危险因素,并基于少数类样本合成技术SMOTE算法构建风险预警模型.方法选择2019年1月至2021年11月行盆底功能障碍筛查的242例初产妇为研究对象.收集患者一般资料,采用单因素和多因素分析筛选盆底功能障碍发生的危险因素,并基于SMOTE算法构建影响盆底功能障碍发生的原始数据集,最后验证模型的预测...
目的:探索食管癌放化疗患者肺部感染的独立危险因素,并基于合成少数派过采样技术(SMOTE)算法建立个体化预测模型.方法:选取2016年1月至2022年3月四川省南充市中心医院收治的行同步放化疗的197例食管癌患者作为研究对象.根据患者治疗期间是否发生肺部感染分为感染组( n=23)和未感染组( n=174).采用单因素和二元logistic...
基于SMOTE算法和决策树的绝经后骨质疏松性骨折分类模型建构 优质文献 相似文献 参考文献基于SMOTE算法和机器学习模型建立原发性肝癌术后的预后预测模型 目的 基于合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)算法和机器学习模型构建原发性肝癌术后的预后预测模型.方法 选取美国国立癌症研究... ...
由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约.为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)算法和条件生成对抗网络(conditional generative adversarial nets,CGAN)的航班延误预测模型.首先,利用SMOTE算法对原始数据集...
本发明提供了一种基于SMOTE算法的过采样方法,装置和电子设备.该方法包括:获取历史样本数据集,确定正,负样本及其对应数量;确定多数类样本数据和少数类样本数据,并进行数据向量化处理;使用离异点监测方法,从所述少数类样本数据集中筛选目标样本数据;基于SMOTE算法,对所述目标样本数据进行过采样,以生成特定数量的新样本数据...
一种基于改进的SMOTE算法的不平衡数据处理方法,涉及机器学习技术领域,针对现有不平衡数据集处理方法中由于不能够避免处理过程中产生噪声数据样本,并且可能使新生成的数据样本分布在原数据集中的少数数据样本的中心,进而导致分类效果差的问题.本发明使用支持向量机和Kmeans算法的结合去除数据集中的噪声数据,通过限制样本生成...
面向不平衡数据集的改进型SMOTE算法 针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本... 王超学,张涛,马春森 - 《计算机科学与探索》 被引量: 29发表: 2014年 一种基于改进的SMOTE算法的不平衡数据...
在处理非平衡大数据集中,提出一种基于优化SMOTE方案的分类算法研究,在临近样本插值分类中引入分簇聚类的理念,具体分为安全样本,危险样本和干扰样本,并重点对安全样本做插值处理.对插值后的数据样本做区间化处理,能够改善插值后数据过于集中的状况,提高样本分布的均匀度.算法性能验证结果表明,分类算法的规模成长性更好,具...