最近在写论文,结果在数据分析遇到了瓶颈,真的是数据分析新手。恳请指点。因为自己论文里的分析数据和背景比较复杂。所以用这个比较简单的例子来请教各位同学。
如图,一共有3个变量,语文,数学,英语。
问题一: 想要对数学。英语,语文进行横向对比。但是因为满分不同,分数不能直接对比。需要标准化。请问应该如何标准化呢?以下哪种方法比较好呢?
想法1: 每个同学的成绩/满分,比如第一个同学语文94分。94除以100,得到94%。即该同学的得分率。然后算出所有同 学所有科目的得分率。 选出得分率最高的那个科目
想法2: 通过分析里的Z scores进行数据标准话,然后把语数英3项的最高者选出来。
问题二: 想要观察变量之间的关系。比如 在3个科目当中,英语成绩最高的同学,组成了一个集合,叫英语组。那么在英语组中, 英语和数学的关系,英语和语文的关系。
比如最后得出结论:在英语组中,英语成绩越好的同学,数学越差。 英语成绩和语文成绩没有直接关系。
得出这种结论需要使用什么分析法呢?