variable变量python python variance_inflation_factor 1,去除线性共线性,使变量数据稀疏。 共线性检测: 1,VIF(方差膨胀因子),1/(1-R**2)以10为分界点,(0-10)不存在多重共线性问题,>10存在多重共线性问题。 (vif包建议5以上则存在共线性问题) from statsmodels.stats.outliers_influence import variance_inflati...
def checkVIF_new(df): from statsmodels.stats.outliers_influence import variance_inflation_factor # 默认情况下不会添加截距,使得获得的VIF值偏大; # 因此,在数据框中再增加一列,代表一个常数(使用常数1)。这将是方程式的截距项。 df['c'] = 1 # name = df.columns x = np.matrix(df) VIF_list =...