用交叉验证的目的是为了得到可靠稳定的模型。在建立PCR 或PLS 模型时,一个很重要的因素是取多少个主成分的问题。用cross validation 校验每个主成分下的PRESS值,选择PRESS值小的主成分数。或PRESS值不再变小时的主成分数。[1] 常用的精度测试方法主要是交叉验证,例如10折交叉验证(10-foldcross validation),将数据...
很明显,如果不是数据很少的情况,也不至于只留一个样本作为验证集了,所以这种方法主要还是用于样本数据非常少的情况。这种方法只有一个数据不参与训练,最大限度的使训练数据接近原始数据的分布。 5.如何选择 从上面三种交叉验证的操作过程可以知道,如果只是粗略的建模,简单交叉验证即可,一般情况下都是用K折交叉验证,而...
10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法准确性的估计。 之所以选择将数据集分为10份,是因为通过利用大量数据集、使用不同学习技术进行的大量试验,表明10折是获得最好误差估计的恰当选择,而且也有一些理论根据可以...