我在写一篇关于研究学生每周学习时间与GPA 的关系的文章。(GPA就是大学的平均绩点)
因变量为每个学生的GPA, 自变量为study hours ,还有控制变量如年龄,专业,性别等等。
我所设计的自变量有如下:性别,自己的学习时间,同学的学习时间,年级,专业,学习方法,逃课的次数等等
我先进行OLS,但是很明显是有bias 的。
所以我写这篇的主要任务就是通过设计一些东西,来使我所得到的结果能够更加准确和有说服力。
我目前想到的是对于study hours 有一个工具变量,这个工具变量为其同学的学习时间,然后用2sls 进行。
(注意我的问题来了)
另外我还考虑到一些问题:
1.比如我调查的是大一到大四的学生都有,但是有可能大四学生学习时间少了。
2.比如专业的不同,学生的学习时间也会有差别,比如一些研究性专业比一些实践性专业的学习时间更加长。
3.对于GPA来说,不同的老师对于成绩的评定要求也不一样,一些老师严格一些,85分才能得到B,而一些老师75分就能得到B
4.每个学生自身的学习能力也不同,一些天生聪明的学生学习时间少,但是GPA 也很高,但是一些学生学习时间很长,但是GPA 不一定会很高。
我的问题是 通过什么样的设计能解决我对于以上四点内容的问题呢?
谢谢,大神求教