决策树通过判断特征来递归生成,直到不能继续下去为止。这样产生的决策树对训练集预测通常很准确,但是对测试集没那么准确,容易出现过拟合的现象。在学习中决策树过多考虑到如果将训练样本正确分类,却忽视了模型的复杂度,使学到的模型过于复杂,所以就需要剪枝算法。 决策树的剪枝算法通过最小化决策树的整体损失函数来实现。
1、基于weka的数据分类分析实验报告1实验目的(1)了解决策树C4.5和朴素贝叶斯等算法的基本原理。(2)熟练使用weka实现上述两种数据挖掘算法,并对训练出的模型进行测试和评价。2实验基本内容本实验的基本内容是通过基于weka实现两种常见的数据挖掘算法(决策树C4.5和朴素贝叶斯),分别在训练数据上训练出分类模型,并使用校验数...