本人最近在分析一组问卷调查数据,里面涉及到很多问题、很多变量,处理起来很头疼,希望有大神能指点指点!打个比方,比如这是一个关于学院学生水果消费的调查数据,以班级为单位,细分到每个学生,向每个学生提问“你最近一周有买水果吗?”,有4个选项:A、买了低价位的水果如香蕉等; B、买了中等价位的水果如苹果等; C、买了高价位的水果如荔枝、车厘子等;D、都没有买。数据是以以下形式展示的(1表示选择了该选项,0表示未选)班级 学生 A B C D
001 0011 0 0 1 0
001 0012 0 1 0 0
002 0021 0 0 0 1
........
现在我想统计班级买水果的情况,只要该班级有一个学生选了前三个选项中的一个,就表示该班级买了水果,用1表示;反之则表示未买,用0表示。生成的新的变量按以下格式展示:
班级 是否买了水果
001 1
002 0
.......
求问各位大神,该怎么用stata的bys命令实现呢?恳请解答下,感激不尽!