2、by: 按照某一变量的取值来进行分析 例:by group,sort: regress Y x1 x2 //按照不同的组,对Y做回归分析 3、weight: 加权或者頻数 例:fw=頻数变量 //多用在四格表资料中或者原资料未给出所有值,只给出了值和对应的頻数 4、if: 用条件语句指定条件 例:drop if group==1|group==2 ...
让我们更细致地解读一下group()函数的工作原理。 上面的分析中我们用到了如下两条核心命令: sort x \\ 由小到大排序 gen g = group(2) \\ 等分两组 也就是说,gen命令下的group()函数按如下两个步骤工作: Step 1:使用sort命令对样本进行排序; Step 2:将观察值平均分配为两组 (group(2))。比如,上例...
例:by group,sort: regress Y x1 x2 //按照不同的组,对Y做回归分析 3、weight: 加权或者頻数 例:fw=頻数变量 //多用在四格表资料中或者未原资料未给出所有值,只给出了值和对应的頻数 4、if: 用条件语句指定条件 例:drop if group==1|group==2 //把group变量值为1或者2的记录删除掉 5、in:指定...
2、by: 按照某一变量的取值来进行分析 例:by group,sort: regress Y x1 x2 //按照不同的组,对Y做回归分析 3、weight: 加权或者頻数 例:fw=頻数变量 //多用在四格表资料中或者未原资料未给出所有值,只给出了值和对应的頻数 4、if: 用条件语句指定条件 例:drop if...
egen rank_ie = rank(ie), group(age) 以上例子展示了gen和egen命令的基本用法,通过这两个命令,我们可以轻松实现对Stata数据集的预处理、变量生成和统计分析操作。在实际应用中,熟练掌握gen和egen命令将有助于提高数据处理的效率和准确性,为后续的统计分析和建模工作打下良好的基础。希望本文对使用Stata进行数据处理...
16、gen: 生成新变量 gen bh=_n //将数据库的内部编号赋给变量bh 17、replace:更改变量值 replace z=. if z=9 //将所有z=9的值用缺失值代替 renvars: 批量修改变量名 renvars X1-X5, prefix(mono_) //把变量X1-X5的变量名前加前缀mono_;同理后缀是postfix ...
在使用Stata的gen命令中的group()函数进行数据分组时,一个潜在风险在于函数的工作原理可能导致分组结果不稳定。具体来说,group()函数在对某个变量排序后进行分组,但排序时的随机性可能影响分组结果的唯一性。让我们通过一个小例子来揭示这一问题。假设我们有以下数据,对变量x进行排序并执行gen g = ...
我们经常使用generate(后文简称gen) 命令提供的group()函数对某个变量进行分组,产生分组变量gg,继而基于gg变量进行后续的分组回归分析。 例如,在公司金融中,常用如下代码产生融资约束的分组指标: *-用公司规模衡量融资约束,分成三组 .bysort code:egen av_size=mean(size) ...
sort group(以group变量为例从小到大排序) by group:summarize x() Stata中常用的命令 命令关键词 缩写 执行的操作 describe d 显示当前数据集,或者指定数据集的概况 display di 以即时方式对指定的表达式进行计算,并给出结果 generate gen 产生新变量:gen变量名=数值 ...
gen foreign1=foreign label define for 1 For 0 Dom label values foreign1 for *在散点图中显示汽车里程数的范围及每一个标有组值的点,每组观测值将计算出最多2层hull并共享一个组值 cvxhull mpg weight, group(foreign) hulls(2) scat(mlab(foreign1) mlabpos(c) msym(i) ysc(r(0,60))) cycle...