egen命令相对复杂一些,它能生成一些“gen”命令无法生成的变量。例如可以生成wagesum为每个人的工资和,以及生成wagemedian为工资的中位数(median),wagemax为工资的最大值。 格式: egen wagesum=sum(wage) egen wagemedian=median(wage) egen wagemax=max(wage) 更复杂的如想产生一个变量“w...
### 基础概念 在Stata中,基于多个条件创建新变量通常涉及使用`egen`或`egenmore`命令,或者更常见的`generate`(简写为`gen`)和`replace`命令结合条件语句(...
egen drop_x = drop(x), if(missing_x == 1) 这个命令将会删除含有缺失值的观测,并将结果保存在drop_x变量中。 对于缺失值的分析,我们可以使用egen命令中的其他函数来计算缺失值的数量、比例、均值等。 例如,我们可以使用egen的count函数计算每个变量的缺失值数量: egen count_missing = count(missing_x) 这...
egen minx1=min(x1)(最小值) egen medx1=med(x1)(中数) egen modex1=mode(x1)(众数) egen totalx1=total(x1)(得出x1的总数) egen rowsd=sd(x1 x2 x3)(得出x1、x2和x3联合的标准差) egen rowmean=mean(x1 x2 x3)(得出x1、x2和x3联合的平均值) egen rowmax=max(x1 x2 x3)(联合最大值) ...
egen maxx1=max(x1)(最大值) egen minx1=min(x1)(最小值) egen medx1=med(x1)(中数) egen modex1=mode(x1)(众数) egen totalx1=total(x1)(得出x1的总数) egen rowsd=sd(x1 x2 x3)(得出x1、x2和x3联合的标准差) egen rowmean=mean(x1 x2 x3)(得出x1、x2和x3联合的平均值) ...
gen id = _n : 创建索引,即观测值所在行数,本例中为1-74 bysort rep78: gen repairIdx = _n gen totRows = _N : 创建一列,显示每组中的观测值总数,本例中都为74 bysort rep78: gen repairTot = _N egen meanPrice = mean(price), by(foreign) : 计算每组的平均价格编辑...
egen maxx1=max(x1)(最大值) egen minx1=min(x1)(最小值) egen medx1=med(x1)(中数) egen modex1=mode(x1)(众数) egen totalx1=total(x1)(得出x1的总数) egen rowsd=sd(x1 x2 x3)(得出x1、x2和x3联合的标准差) egen rowmean=mean(x1 x2 x3)(得出x1、x2和x3联合的平均值) ...
从结果中可以看出,egen 提供的 sum() 函数计算该变量的总和,rsum() 计算行数值的相加和,rowtotal() 函数与 rsum() 功能一致。需要注意的是,rowtotal() 不能简写为 rtotal()。 此外,egen 还提供了丰富的针对行操作的函数,如 rowfirst()、rowlast()、rowmax()、rowmean()、rowmedian()、rowmin()、row...
replace age_group = 3 if age >= 50 二、egen命令 egen命令用于对数据进行分组、聚合等计算操作,其语法格式为: egen 新变量名 = 统计函数(变量列表) 其中,统计函数可以是count、mean、sum、max、min等各种统计函数,变量列表是需要进行统计计算的变量集合。 1. 例子1:计算组内平均值 ...
egen id = seq, from(1) to(3) block(4) bysort id: gen yr = 2000 + _n gen x = runiform * Lag(s) bysort id (yr): gen xlag = x[_n-1] * Lead(s) bysort id (yr): gen xlead = x[_n+1] 计算行数count countifmonth==10 ...