以决策树为例,决策树在tidymodels中只有3个可以调节的超参数(这点比mlr3差远了)。 决策树的超参数调优之前专门介绍过,并配套了多种可视化方法,可参考:R语言决策树超参数调优及可视化,今天选择决策树主要是为了演示tidymodels的用法。 训练集,测试集划分: set.seed(123) cell_split <- initial_split(cells %>% ...
这是默认情况下建立好的决策树,没有进行任何的超参数调优,这样的一棵树,会自由地“生长”,直到不能再生长为止。 决策树的超参数有很多,大部分都是和剪枝有关的,通过剪枝参数,可以有效限制树的生长(防止过拟合),常见的有: 树的深度:设置树分支的最大深度; 使用的特征个数:设置建立模型时最多使用几个特征; ...