Fisher Score算法思想 Fisher Score的主要思想是鉴别性能较强的特征表现为类内距离尽可能小,类间距离尽可能大。 根据标准独立计算每个特征的分数,然后选择得分最高的前m个特征。缺点:忽略了特征的组合,无法处理冗余特征。 单独计算每个特征的Fisher Score,计算规则: 定义数据集中共有n个样本属于C个类ω1, ω2…, ...
摘要: Fisher Score (FS)是一种快速高效的评价特征分类能力的指标,但传统的FS指标既无法直接应用于多标记学习,也不能有效处理样本极值导致的类中心与实际类中心的误差。提出一种结合中心偏移和多标记集合关联性的FS多标记特征选择算法,找出不同标记下每类样本的极值点,以极值点到该类样本的中心距离乘以半径系数筛选...
T P 3 9 1 基于文本分类的 Fisher Score 快速多标记特征选择算法 汪正凯 1,沈东升 2,王晨曦 2 (1. 福建省粒计算及其应用重点实验室,福建 漳州 363000;2. 闽南师范大学 计算机学院,福建 漳州 363000) 摘要:Fisher Score(FS)是一种快速高效的评价特征分类能力的指标,但传统的 FS 指标既无法直接应用于多标记...