好问题,实际上大部分的特征选择方案都存在这样的问题,无论是嵌入式,包裹式还是过滤式,这也是很多人...
因此,如果使用boruta算法进行特征筛选,理论上来说是可以放入CNN的。但是!随机森林这个信息系统十分不稳定...
如果你的数据量较大,特征维度高,且目标是构建一个预测性能较强的模型,那么随机森林将是一个更好的选择,因为它不仅能提供特征重要性的评估,还能带来较好的预测性能。总之,最佳的方法取决于具体的数据情况和分析目标。在实践中,也可以尝试结合使用这两种方法,先用灰色关联分析快速筛选出关键特征,再...
基于特征重要度二次筛选的DDoS攻击随机森林检测方法.首先,该算法对原始数据集进行预处理并提取特征;其次,该算法为了从所选模型中选择最相关的变量,使用RF变量重要度准则,利用随机森林的重要性评分对变量进行排序;然后,在随机森林特征排序的基础上,对变量计算累积重要性并得到最重要变量;接着,使用所筛选出的最重要变量...
你的题目是对的。
随机森林优化 | 调整超参数: 随机森林有许多超参数,如决策树的数量、每棵树的最大深度、每个节点的最小样本数等。通过调整这些超参数,可以优化模型性能。可以尝试使用交叉验证来找到最佳的超参数组合。增加决策树数量: 增加随机森林中决策树的数量通常可以提高模型的准确率,但要注意防止过拟合。特征工程: 特征工程是...
无论是嵌入式,包裹式还是过滤式,这也是很多人的误区以为一个feature importance能打天下 因为每一种进行特征选择的方法都有一定的侧重性,比如spearman相关性对于tree来说并不是一个好的过滤式指标,随意结合使用得到的结果是不可知的可能有时候好有时候坏看运气,当然也有一些较为通用的特征选择方案比如方差或者缺失值...
所以这CNN上,不建议进行数据筛选,毕竟有稀疏性可以自动滤掉它认为不重要的数据。