全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
766 3
2023-07-24
特征工程时,取值只有两种数值的列,如某列取值只能是36或者64,该列需要onet-hot编码吗?还是不用处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-7-24 17:47:56
只有两种数值的列,如某列取值只能是36或者64,不需要进行 One-Hot 编码。 One-Hot 编码主要用于将具有多个离散取值的列转换为二进制形式,以便机器学习模型能够更好地理解和处理这些离散特征。
当某个列只有两个取值时,例如36或者64,可以将其视为一个二元变量(binary variable)。你可以将其中一个值(例如36)表示为0,另一个值(例如64)表示为1,这样就可以直接在模型中使用这个二元特征。使用 One-Hot 编码在这种情况下不是必要的,因为 One-Hot 编码会引入额外的冗余特征,而且对于只有两个取值的情况,已经能够很好地表达这个特征。将其表示为0和1已经足够传递其信息。
如果有更多的取值,例如三个或更多,才需要考虑使用 One-Hot 编码。而对于二元特征,直接将其用0和1表示就足够了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-7-25 16:14:08
att006 发表于 2023-7-24 17:47
只有两种数值的列,如某列取值只能是36或者64,不需要进行 One-Hot 编码。 One-Hot 编码主要用于将具有多个 ...
感谢兄弟评论,不过感觉一股chartgpt的味道,哈哈哈
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-7-25 19:22:23
xf503 发表于 2023-7-25 16:14
感谢兄弟评论,不过感觉一股chartgpt的味道,哈哈哈
用chartgpt是另一种幸福。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群