想研究金融知识的决定因素,某问卷中对于金融知识有三个相关问题,分别为var1 var2 var3三个变量,已对三个变量进行编码1为正确答案,2为错误答案,3为不知道,缺失值为"."。想请教大神们如何统计回答这三个问题正确个数的频次和所占比例?
实在抱歉,不能附上原始数据,因为用dataex的时候提示“I/O error writing .dta file
Usually such I/O errors are caused by the disk or file system being full.”
数据大致如下:
pid var1 var2 var3
202001 1 1 1
202002 2 2 1
202003 3 3 .
202004 3 2 1
202005 2 1 3
202006 1 2 1
202007 3 2 .
202008 . 2 1
202009 2 2 2
202010 2 1 1
202011 3 3 3
202012 1 2 1
202013 2 3 1
第一步希望统计每个问题(var1 var2 var3)回答正确的比例,用tab只能得到单个问题的图表,请教能生成下表格一的命令是什么呢?
表格一
| | var1 | var2 | var3 |
| 正确 | % | % | % |
| 错误 | % | % | % |
| 不知道 | % | % | % |
第二步希望统计不同问题回答正确个数的比例,比如三个问题都回答正确、两个问题回答正确、一个问题回答正确、都不正确的观测数和比例。如下表二
| | 0 | 1 | 2 | 3 | 平均数量 |
| 正确 | % | % | % | % | |
| 错误 | % | % | % | % | |
| 不知道 | % | % | % | % | |