不平衡学习问题.在大多真实数据集的分类任务中,数据类别间的个数是不等的,并且往往类间个数差异较大.而传统机器学习模型擅长训练类间平衡的数据,针对不平衡的数据模型效果不佳,从而引起了有关不平衡学习的研究.本文在原始的Adaboost基础上,选取了决策树为基分类器,并结合代价敏感学习的主要思想内涵,使用代价损失...
第33卷第6期2013年l1月湖北工程学院学报JOURNALOFHUI3EIENGINEERINGUNIVERSITYV0L.33N0.6NOV.2013一种基于置信度差异代价敏感的主动学习算法武永成(荆楚理工学院计算机工程学院,湖北荆门448000)摘要:主动学习时向专家查询得到的标注如果带有噪声,将会影响学习的性能。为减少噪声,人们提出了基于“少数服从多数”的多专家主...
针对现实生活中大规模不平衡数据的分类问题,设计了一种基于云计算平台的代价敏感集成学习分类算法。Hadoop云计算平台对海量数据进行划分用于并行学习,同时结合代价敏感的思想对学习得到的基分类器进行加权集成,实现了云计算平台上的代价敏感集成学习分类模型。仿真实验表明该模型能够明显提高少数类的查全率,同时Hadoop的并行...
基于"少数服从多数"的多专家主动学习算法,但该算法的缺点是代价往往太高.文章采用了一种自我训练(self-training)方法,对某些平均置信度高的样本,直接确定其分类标注,不必向专家查询,以节省学习代价.同时,使用置信度差异作为度量标准,选取那些最不确定的样本向专家查询,提高了学习效率.在UCI数据集上验证了本文算法的...
大多数非均衡数据集的研究集中于纯重构数据集或者纯代价敏感学习,本文针对数据集类分布非均衡和不相等误分类代价往往同时发生这一事实,提出了一种以最小误分类代价为目标的基于混合重取样的代价敏感学习算法.该算法将两种不同类型解决方案有机地融合在一起,先用样本类空间重构的方法使原始数据集的两类数据达到基本...