全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1433 7
2018-12-14
金融问题中,是否不能应该简单对训练集和测试集分开归一化(标准化)?原因是如果进行回测,已知的信息只有训练集,若对测试集统一归一化(标准化),将会动用未来信息。如果利用训练集中的样本最大与最小值归一化测试集,似乎有不妥存在。

有没有高手知道这个问题的有效解决方法?非常感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-12-15 11:40:35
jmq19950824 发表于 2018-12-14 21:10
金融问题中,是否不能应该简单对训练集和测试集分开归一化(标准化)?原因是如果进行回测,已知的信息只有 ...
虽然做的不是金融问题,但应该就是用训练集进行标准化吧,如果测试集有落在范围外的只能说训练集样本量不够充足
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-12-15 19:18:19
jmq19950824 发表于 2018-12-14 21:10
金融问题中,是否不能应该简单对训练集和测试集分开归一化(标准化)?原因是如果进行回测,已知的信息只有 ...
资本市场几百年,多少牛人,这个问题早解决了,你参考一下布林通道的思路。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-12-18 16:07:45
确实如1楼所说,若发生超界现象,是训练集选取不恰当
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-12-18 19:22:37
阿扁V5 发表于 2018-12-18 16:07
确实如1楼所说,若发生超界现象,是训练集选取不恰当
好的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-15 15:47:51
一、整个问题更像是一个数学问题,说早已经解决的,说了等于没说,二、未来的样本不能用来判断过去吗,个人认为得看数据间的函数关系,三、有说超界的,那只是界的定义没设定好,否则怎么会超。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群