你需要创建一个新变量,用于存储每个id的累积百分比值。假设你将该变量命名为"cum_percent",可以使用以下命令创建:
gen cum_percent = .
然后,你可以使用以下命令计算每个id的每个变量的累积百分比值:
by id: egen cum_percent_var1 = pctile(var1), p(1/9)
by id: egen cum_percent_var2 = pctile(var2), p(1/9)
by id: egen cum_percent_var3 = pctile(var3), p(1/9)
by id: egen cum_percent_var4 = pctile(var4), p(1/9)
by id: egen cum_percent_var5 = pctile(var5), p(1/9)
这将计算出每个id的每个变量的每个取值的累积百分比值,并将其存储在以"cum_percent"开头的新变量中(例如"cum_percent_var1"表示变量var1的累积百分比值)。
最后,你可以使用以下命令计算每个类别的累积百分比值:
egen cum_percent_1_1_1_1_1 = rowtotal(cum_percent_var1==1 & cum_percent_var2==1 & cum_percent_var3==1 & cum_percent_var4==1 & cum_percent_var5==1)
egen cum_percent_1_2_3_4_5 = rowtotal(cum_percent_var1==1 & cum_percent_var2==2 & cum_percent_var3==3 & cum_percent_var4==4 & cum_percent_var5==5)
egen cum_percent_2_3_4 = rowtotal(cum_percent_var1==2 & cum_percent_var2==3 & cum_percent_var3==4 & missing(cum_percent_var4, cum_percent_var5))
其中,"cum_percent_1_1_1_1_1"表示取值为(1,1,1,1,1)的累积百分比值,"cum_percent_1_2_3_4_5"表示取值为(1,2,3,4,5)的累积百分比值,"cum_percent_2_3_4"表示取值为(2,3,4,.,.)的累积百分比值。
这些命令将计算出每个类别的累积百分比值,并将其存储在以"cum_percent_"开头的新变量中。