一、缺失值的类型 在进行缺失值处理之前,首先需要确定缺失值的类型。一般来说,缺失值可以分为以下几类: 1. 完全随机缺失:缺失值的出现没有规律,是完全随机的。这种情况下,缺失值对数据的分析没有影响。 2. 非随机缺失:缺失值的出现是有规律的,例如,某些病人可能不愿意公开自己的病情。 二、缺失值处理方法 1. 删除缺失值 这是最常见的缺失
δ2(t+1)=∑i=1mxi2+(n−m)(μ2(t)+δ2(t)) 重复上述步骤直到收敛,即可得到较为精确的μ和σ2的估计值。 Python代码实现 弄明白原理之后,用代码实现还是不难的。本次实验使用UCI的Iris数据集,数据维度为4,设前面3个维度数据正常,第4个维度存在数据缺失(50%),则首先对数据进行预处理,然后构造低配...