补充(个人意见,欢迎指正):
一般来说,研究变量之间的关系都会start from linear regression。因为,首先你要确定的是,变量之间到底有没有关系,而linear regression是一种简单高效,easy to interpret的方式(其实不管变量之间eventually是线性还是非线性关系,它们在你run linear regression时,x都会某种程度上explain y。)之后你可以检查线性模型是否有high explanatory power, by performance measure例如R squared,residual plot;或者用线性图看看line of best fit 是不是很好地fit大部分的data points。如果不满意线性模型给出的结果,我们这时候会质疑线性相关性,因而建立非线性相关模型。(注:经验之谈是,基本上如果两个变量之间有明显的可以被common sense理解的关系时,比如随着年龄的增长健康状况会逐渐下降,这时应该就是线性相关;但是当两个变量之间有着某种你不能完全解释或者量化成比例的关系时,比如当地犯罪率和当地人口密集度的关系时,这时就很有可能是非线性相关。因此很多时候,by common sense,你可以大概判断变量关系从而直接引用线性模型,但是最好验证否则不够严谨。)
纯属个人看法,希望能帮助到你!
谢谢大家的回答,much more clear.大概是因为任何变量之间的关系, 是线性还是非线性,我们都不清楚。但是由于线性模型比非线性模型的资料多,可检验线性关系是否成立的方法多,因此,大多研究首先采用线性模型。然后再通过一系列检验方法,如t-test, R square, F test等来检验我们得到的变量之间的关系在一定程度上是否成立,而没有采用画相关图的方法检验。但是实际上可能还存在更加符合实际关系的其他模型。