首先,我们需要计算出数据集中的分位数。Stata提供了pctile命令来计算百分位数。以下是使用pctile命令计算25%、50%和75%三个分位数的示例: pctilex,p(25 50 75) 其中,“x”是要计算分位数的变量名,“p(25 50 75)”表示要计算25%、50%和75%三个百分位数。 分组操作 接下来,我们可以根据计算得到的分位数...
Stata适合分位数(包括中位数)回归模型,也被称为最小绝对值(LAV)模型、最小绝对偏差(MAD)模型和L1-norm 模型。 中值回归根据自变量的值估计因变量的中值。这类似于估计因变量均值的最小二乘回归。换句话说,中位数回归寻找的是使残差绝对值之和最小化的回归平面,而不是残差平方和最小化的回归平面。 webuse aut...
Koenker and Bassett(1978)提出了“分位数回归“(Quantile Regression,简记QR)。2.1 原理 OLS“均值回归”,目标是**最小化残差平方和∑。。。,**所以很容易收到极端值的影响。与 OLS 不同,分位数回归估计的是解释变量 x 与被解释变量 y 的分位数 之间线性关系。目标是最小化残差绝对值,...
Stata分位数分析通常使用四分位数(Q),四分位数是指将一组数据按从小到大的顺序排列后,把数据分成四等份。每一份被称为四分位数,由Q1、Q2和Q3来表示。Q1是数据集中25%的数据,Q2(即中位数)是数据集中50%的数据,Q3是数据集中75%的数据,Q4是数据集中100%的数据。 四分位数是概括一组数据中四个主要统计...
紧接着,-xtile- 命令同样可以实现分组功能,但以类别变量形式输出。例如,创建四个分组,每组包含25%的数据,代码如下:xtile x_bp = bp, nq(4)通过 list 命令并按 x_bp 变量排序,我们可以查看各组的具体内容。最后,-astile- 命令是一个更高效的分位数分组工具。它能够根据市场价值快速创建10...
通过指定p95选项,可以计算变量的95%分位数。 2. pctile命令:这个命令可以根据指定的百分位数计算变量的分位数。例如,pctile varname, p(25 50 75)将计算变量varname的25%、50%和75%分位数。 3. egen命令:该命令可以用于生成新的变量,其中可以计算指定变量的分位数或百分位数。例如,egen new_varname = ...
summ var1 if year == `x', d local a = r(p25) local b= r(p75) replace x1= cond(var1<`a', 0, cond(var1>`b', 1,.)) if month == `x' replace x2=var1-b } #生成虚拟变量 #X-X_star变量,X_star为具体的分位数值。模型用于检验影响的结构性变化。发布...
收入系数的平均后验估计值为 0.56,95% 可信区间 (CrI) 为 [0.52, 0.59]。现在,我们将注意力转移到结果变量的第 25 个百分位数(或 0.25 分位数)上,使用 qreg 指定 quantile() 选项。 . bayes, rseed(19): qreg foodexp income, quantile(0.25) ...
此外,sum命令还会输出25%分位数(25th percentile)、75%分位数(75th percentile)等分位数信息,这些信息可用于判断数据的分位数分布以及偏态状况。 在Stata中,sum命令还可以用于对分类变量进行摘要统计。对于分类变量,sum命令可以计算每个类别的频数(count)和相对频数(proportion)。频数指的是各个类别的样本数,而相对频数...
局部层面,可以观察变量的百分位数,了解变量在不同分位数位置的取值情况。例如,可以查看25%和75%分位数,判断变量的分布形态是否偏态,或者是否存在异常值。 在解读sum detail结果时,还应该注意以下一些要点: 1.变量的统计量应该结合具体背景和研究目的来进行分析和解读。同样的统计量对于不同的变量可能有不同的含义和...