| id | var3 | var4 | new_var |
| 1 | a | 1 | 1 |
| 2 | b | 0 | 1 |
| 3 | b | 1 | 1 |
| 4 | c | 0 | 0 |
| 5 | a | 0 | 1 |
假如现在有三个变量的数据id,var3和var4,现在要生成一个新的变量new_var,计算这个变量的处逻辑是:当var4=1的时候,对应有一个var3的值,现在要找出样本中所有的有这些值的样本生成虚拟变量new_var.
可能我表达的不是太清楚,举个例子吧。
首先看第一行,当var4=1时,var3=a,那么var3中有a的样本在new_var中都为1。
同理第三行,当var4=1时,var3=b,那么var3中有b的样本在new_var中都为1。