全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
570 1
2022-11-10

真实世界数据集包含大小,单位和范围变化很​​大的特征。当特征的尺度不相关或误导时应该执行标准化,而当尺度有意义时不应该标准化。

使用欧氏距离测量的算法对幅度敏感。这里的特征缩放有助于平等地权衡所有特征。

形式上,如果数据集中的某个特征与其他特征相比规模较大,则在测量欧几里德距离的算法中,这个大尺度特征变得占主导地位,需要进行标准化。

特征缩放很重要的算法示例
1. K-Means使用欧几里德距离测量这里的特征缩放问题。
2. K-Nearest-Neighbors也需要特征缩放。
3. 主成分分析(PCA):试图获得具有最大方差的特征,这里也需要特征缩放。
4. 梯度下降:在特征缩放后,Theta计算变得更快,计算速度增加。

注意:朴素贝叶斯,线性判别分析和基于树的模型不受特征缩放的影响。
总之,这是任何算法不是基于距离的是不影响特征缩放。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-11-10 13:40:19
点个赞感谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群