3、模型评估 (1)留出法:直接将数据划分为三个互斥的部分,然后在训练集上训练模型,在验证集上选择模型,最后用测试集上的误差作为泛化误差的估计。 (2)交叉验证法(S折交叉验证法):数据随机划分为S个互不相交且大小相同的子集,利用S-1个子集数据训练模型,利用余下的一个子集测试模型。对S种组合依次重复进行,获取...
则训练出的模型可能更接近于用 D 训练出的模型,但由于 T 比较小,评估结果可能不够稳定准确;若令测试集 T 多包含一些样本,则训练集 S 和 D 差别就更大了,被评估的模型与用 D 训练出的模型相比可能有较大差别,从而降低了评估结果的保真性。
通过特征选择,我们可以剔除不相关或冗余的特征,减少模型的复杂度,提高模型的训练速度,并降低过拟合的风险。 总结 机器学习模型评估与选择是一个关键的任务,交叉验证和特征选择是两个重要的技术。交叉验证可以帮助我们评估模型的性能,选择最佳的模型。特征选择可以帮助我们选择最相关的特征,提高模型的效果和泛化能力。 在...
交叉验证法