MRMR算法通过互信息I(a,b)来衡量两个变量间的相似度,其中a和b分别代表每个特征和输出类别。算法基于三个原则:最大化依赖性、最大化相关性和最小化冗余性。具体而言,算法选择具有最大互信息值的特征,同时确保所选特征与已选特征间具有最小的互信息值,以此来避免选择高度冗余的特征。该方法在特征...
方便学习和使用。总之,利用最大相关最小冗余mRMR算法进行特征选择是一种有效的方法,可以提高机器学习模型的准确性和效率。但是,在进行mRMR算法前,必须进行数据预处理和特征提取,以充分发挥其优势。在具体实现上,matlab提供的mRMR算法工具箱是一个方便易用的工具,值得广大机器学习爱好者使用。
从特征与类标签的重要性及特征之间的冗余度出发,提出了一种基于邻域互信息的最大相关性最小冗余度的特征排序算法NMImRMR. 该方法不仅拓展了信息熵的使用范围,而且能有效地针对各种类型数据集进行特征选择. 在公开UCI数据集上的实验结果表明,本文方法的特征选择结果优于或相当于其他相关特征选择算法. [1] I. Guyon...
同时又使得子集内部的冗余程度尽量少.特征选择算法一般分为过滤式、嵌入式和封装式三大类,其中,过滤式与具体算法相互独立,且易于理解,得到许多学者的广泛关注.过滤式的特征选择算法主要计算特征的重要度,然后按照特征的重要度进行排序.过滤式的特征选择算法主要采用信息熵或大间隔方法.对基于互信息的特征选择算法,一般需...
最小冗余最大相关性(mRMR)是一种滤波式的特征选择方法,由Peng et.al提出。 用途:图像识别,机器学习等 一种常用的特征选择方法是最大化特征与分类变量之间的相关度,就是选择与分类变量拥有最高相关度的前k个变量。但是,在特征选择中,单个好的特征的组合并不能增加分类器的性能,因为有可能特征之间是高度相关的,...
利用最大相关最小冗余mRMR算法对特征变量做特征重要性排序,实现特征选择。通过重要性排序图,选择重要的特征变量,以期实现数据降维的目的。程序直接替换数据就可以用,程序内有注释,方便学习和使用。程序语言为matlab。
过滤式的特征选择算 法主要采用信息熵或大间隔方法.对基于互信息的特征选择算法,一般需对数据集进行离散化,而离散化会 对数据原始信息产生丢失; 若不离散化, 一般采用 Parzen 窗口进行概率密度的估计, 而该方法计算时间复杂 度较高.经典的特征选择算法如:CFS[4],FCBF[5],mRMR[6]等.对基于大间隔的特征选择...