Ridg可以用来探索数据集当中是否有共线性,但是不能特别确定到底是哪一些特征是共线的, Lasso由于形状奇特,在拐点是连续但是不可导,所以在那个点的切线是一在范围只能,只要保证靠过来的等高线的切线在这个范围内就行了,对当前数据集来说,发现使用Lasso,特征减到了30%,精度还是保持在96%,说明当前剩下特征是最重要,可以很好体现出X与Y之间关系特征越多,模型复杂越大,更容易将噪音学习到模型中,导致过拟合,导致泛化能力(在未知数据集下的表)差。模拟的特征越少呢,泛化能力就越强,但是太过的了话,会导致欠拟合