def checkVIF_new(df): from statsmodels.stats.outliers_influence import variance_inflation_factor # 默认情况下不会添加截距,使得获得的VIF值偏大; # 因此,在数据框中再增加一列,代表一个常数(使用常数1)。这将是方程式的截距项。 df['c'] = 1 # name = df.columns x = np.matrix(df) VIF_list =...
variable变量python python variance_inflation_factor 1,去除线性共线性,使变量数据稀疏。 共线性检测: 1,VIF(方差膨胀因子),1/(1-R**2)以10为分界点,(0-10)不存在多重共线性问题,>10存在多重共线性问题。 (vif包建议5以上则存在共线性问题) from statsmodels.stats.outliers_influence import variance_inflati...
from statsmodels.stats.outliers_influence import variance_inflation_factor from statsmodels.tools.tools import add_constant df = pd.DataFrame( {'a': [1, 1, 2, 3, 4], 'b': [2, 2, 3, 2, 1], 'c': [4, 6, 7, 8, 9], 'd': [4, 3, 4, 5, 4]} ) X = add_constant(df)...
方差膨胀因子(Variance Inflation Factor, VIF),可以表征自变量之间的共线性程度,它的大小可以反映出自变量的观察值之间是否存在复共线性以程度。 一、用VIF来检测共线性 VIF的计算公式为: VIFj=11−Rj2 ,其中 Rj2 是多个解释变量辅助回归的可决系数,举个例子: 假如现在的因变量为y,自变量有A、B和C,假设A和...
探索数据中隐藏的秘密,Variance Inflation Factor (VIF)作为特征选择的有力工具,揭示了自变量间的复杂关系。VIF,这个看似简单的统计量,实际上是衡量共线性强度的关键指标。它通过计算自变量之间的多重共线性程度,其核心公式与可决系数息息相关。每当我们质疑变量间的相互影响时,VIF就犹如一盏明灯,指引...