问1:这样的说法不严谨。首先,在统计学的“线性”通常指参数(ß0, ß1...)线性而非变量线性(X1, X2...),楼主的表述有一定问题。
其次,按照楼主的思路理解“线性”,即y = ß0 + ß1*X1才是线性的话,这样的说法还是错误。随意举反例:设真实的模型是因变量与自变量三次的线性关系,那么仅凭自变量二次项与因变量线性关系不明显,就断定因变量与自变量是线性关系,明显错误。
问2:问题不是很大,方法的选择视情况而定,没有普适性的方法。关键在于楼主是验证数据还是探索数据。前者一般直接纳入分析,后者可以采用逐步法分析(向前还是向后随意,虽然张文彤等一些人认为向后存在明显问题。但是只要样本量大,什么都好说~)
祝楼主好运~