我认为不能直接输入,因为年龄、婚姻、收入、教育等变量明显存在共线性,这四个变量的相互作用将影响你模型的预测能力。比较好的做法是,再加上这几个变量的联合变量,然后分组。每个样本中联合变量为1时,则分变量不再为1。比如,年龄大于65且未婚的变量,其联合变量为1,但年龄大于65已经变为0,未婚变量为0。
我认为你仅作二分是不太能说明问题的,一些变量还是多分几层比较好。
古扎拉蒂的《计量经济学基础》第四版中文中,第二册的第553页,其例子与你的问题非常相似,你可以重点参考。
附:我觉得计量经济学是初级还是高级并不重要,高级的无非多会几个估计和检验的方法,无非会推导一些定理。计量最为重要的是,你知道面对一大堆数据时,知道需要用什么方法来解决它,而且知道为什么用这些方法。