Box-Cox 变换是一种幂变换,其中,y是初始数据值,λ 是变换参数(-5≤λ≤5),���∗是变换后的数据。 变换的关键在于找到合适的变换参数λ,下面是一些常见的λ取值和对应的变换方式。 变换的目标是找到将非正态数据变换为正态分布数据的λ。最佳变换将生成变异性尽可能小的数据集。我们可以借助Minitab来...
Box和Cox(1964)早早的研究了该话题,提出了变量变换的思想并提出了一个系统的方法来估算变换函数,使响应变量在参数λ下具有如下形式: Y(λ)={Yλ−1λ,ifλ≠0log(Y),ifλ=0 在上面的BMI问题中,λ=2,在柯布—道格拉斯生产函数问题中,λ=0;由高等数学简单的极限知识,我们知道 limλ→0Yλ−1λ=...
Box-Cox 转换可以有效地桥正数据的偏斜性。对于正偏 斜的数据,选择λ值小于 1 可以使数据向左移动,...
Box-Cox变换 Box-Cox 变换是一种幂变换,其中,y是初始数据值,λ 是变换参数(-5≤λ≤5),y∗是变换后的数据。 变换的关键在于找到合适的变换参数λ,下面是一些常见的λ取值和对应的变换方式。 变换的目标是找到将非正态数据变换为正态分布数据的λ。最佳变换将生成变异性尽可能小的数据集。我们可以借助Minita...
变换的目标是找到将非正态数据变换为正态分布数据的λ。最佳变换将生成变异性尽可能小的数据集。我们可以借助Minitab来找到合适的λ。 从输出的Box-Cox图中,可以发现λ的估计值0.04可以最大程度地减小Y函数标准差。但在任何实际情况下,你可能需要一个对应于容易理解的变换的λ值,如平方根(λ为 0.5)或自然对数(...
图1 Box-Cox 变换效果示例 第一列:原数据的总体分布、样本频率直方图和 q-q 图。 第二列:将样本进行 Box-Cox 变换后,新样本的频率直方图和 q-q 图(总体分布略)。 那么,是怎样的λ才能有这样好的效果呢?答案是0.16,大致相当于开6次方根。如果光靠...
这就是我们通常使用Box-Cox变换进行的操作。另一个想法可以是转换解释变量, 例如,我们有时会考虑连续的分段线性函数,也可以考虑多项式回归。 “凸规则”变换 “凸规则”(Mosteller. FandTukey, J.W. (1978).DataAnalysisandRegression)的想法是,转换时考虑不同的幂函数。
图1 Box-Cox 变换效果示例 第一列:原数据的总体分布、样本频率直方图和 q-q 图。 第二列:将样本进行 Box-Cox 变换后,新样本的频率直方图和 q-q 图(总体分布略)。 那么,是怎样的λ才能有这样好的效果呢?答案是0.16,大致相当于开6次方根。如果光靠瞎碰,估计找到这个变换不太容易吧?
过程能力分析02—Box-Cox变换 在上一文章《过程能力分析01—不要忽略“稳定”》中,我们强调了做过程能力分析之前需要稳定的过程,在本篇文章中我们来讨论另外一个前提-数据正态。其中我们在之前的文章中对正态性问题已经有过一些讨论,详见《数据非正态如何分析?您可能问了错误的问题!》 但是今天我们想进一步讨论非...