要解决这个问题就需要对决策树进行「剪枝」。 剪枝的方案主流的有两种,一种是预剪枝,一种是后剪枝。 所谓的预剪枝,即是在生成树的时候就对树的生长进行限制,防止过度拟合。比如我们可以限制决策树在训练的时候每个节点的数据只有在达到一定数量的情况下才会进行分裂,否则就成为叶子节点保留。或者我们可以限制数据的比...
要解决这个问题就需要对决策树进行「剪枝」。 剪枝的方案主流的有两种,一种是预剪枝,一种是后剪枝。 所谓的预剪枝,即是在生成树的时候就对树的生长进行限制,防止过度拟合。比如我们可以限制决策树在训练的时候每个节点的数据只有在达到一定数量的情况下才会进行分裂,否则就成为叶子节点保留。或者我们可以限制数据的比...