将数据分成5份,其中一份作为验证集。然后经过5次(组)的测试,每次都更换不同的验证集。即得到5组模型的结果,取平均值作为最终结果。又称5折交叉验证。 2.2.KNN代码实现 2.3超参数搜索-网格搜索(Grid Search) 有很多参数是需要手动指定的(如k-近邻算法中的K值),这种叫超参数。但是手动过程繁杂,所以需要对模型预...
random_state:int, 默认为None当shuffle为True时,如果random_state为None,则每次运行代码,获得的数据切分都不一样,random_state指定的时候,则每次运行代码,都能获得同样的切分数据,保证实验可重复。random_state可按自己喜好设定成整数,如random_state=42较为常用。当设定好后,就不能再更改。 使用KFold类需要先初始...
下一步至关重要,我们将创建一个for循环,该循环将迭代我们指定的回合数,并将包含两个不同的交叉验证对象。 在此示例中,我们将对外部循环和内部循环使用5倍交叉验证,并将每个回合(i)的值用作两个CV对象的random_state。 然后,我们继续创建和配置对象以执行超参数优化。在这种情况下,我们将使用网格搜索。请注意,我...