全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 悬赏大厅 求助成功区
15968 9
2019-10-18
悬赏 10 个论坛币 已解决
要跑一个回归,样本有点少,做出来可能性质不好,不知对于这种情况能否通过数据生成的方式扩大样本量?具体该如何处理呢?请各位高人指点下~~~

最佳答案

ggsimiDo 查看完整内容

不要想的太片面,所谓smote算法就是基于KNN算法对原有样本进行随机衍生,所以你可以直接对原样本进行smote算法从而衍生数据,唯一的问题是如果你的数据样本分布与实际样本分布(无法知晓)的偏差过大,那么衍生数据后的数据样本的回归结果可能误差较大
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-10-18 15:57:19
不要想的太片面,所谓smote算法就是基于KNN算法对原有样本进行随机衍生,所以你可以直接对原样本进行smote算法从而衍生数据,唯一的问题是如果你的数据样本分布与实际样本分布(无法知晓)的偏差过大,那么衍生数据后的数据样本的回归结果可能误差较大
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-19 23:26:49
KNN可以做回归的,具体的思路就是取k个点的均值作为新的样本添加到数据集中。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-21 09:11:30
使用SMOTE算法,可以进行扩大样本数据,python有带有SMOTE算法的包可以调用,你也可以自己手动写。这个链接可以参考 https://blog.csdn.net/niutingbaby/article/details/96104814
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-21 17:38:40
ggsimiDo 发表于 2019-10-21 09:11
使用SMOTE算法,可以进行扩大样本数据,python有带有SMOTE算法的包可以调用,你也可以自己手动写。这个链接 ...
SMOTE算法是不是解决数据不平衡问题的惯常方法呢?除此之外还有没有其他常用的方法?做研究的时候是否可以直接用SMOTE来做,还是需要与其他样本扩充方法进行比较?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-21 17:39:54
袖手尘嚣 发表于 2019-10-19 23:26
KNN可以做回归的,具体的思路就是取k个点的均值作为新的样本添加到数据集中。
那在遇到这种问题时,我们可以直接使用KNN方法吗?是否还有其他比较常用的数据扩充方法,是否还需要在不同方法之间作一个权衡和选择?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群