在决策树分析中,已知输出变量U的先验信息熵计算公式为:E_1l_1lv=∑_lP^p(u_i)log_21/(P(u_1))=∑_(i=1)^n((U_I*l)^1)参考分组变量T1下U的后验条件熵计算公式为:Ent(U |T) = Σ Pt 1 X-Σ P( 7 | t_(1j))log_2P(u_i|t_1,j)计算信息增益的计算公式为:Rains(U,T1)=Ent(U...
参考分组变量T1下U的后验条件熵计算公式为:计算信息增益的计算公式为:Rains(U,T1)=Ent(U)-Ent(U|T1) 设有如下训练数据,其中收入、性别、学历是输入变量,是否购房是输出变量。试计算出第一次分枝时输入变量“收入”的信息增益。 表2 决策树训练数据