全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
7696 2
2015-04-28
有一堆乱七八糟的数据,是一种偏态分布,大小范围是-5到5,想从中挑选出一组样本量最大的符合正态分布(均值为0,标准差为1.2)的数据,该怎么实现呢? 比如有原来有2000个数据,我想找到一组数据(比如1000个)恰好满足正态分布。
说明:
①不要转换后的数据服从正态分布,必须是原始数据。
②不要手工操作,希望是程序控制的。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-4-29 17:50:20
试着剔除极端值看看,把均值3个或2.5个标准差之外的数据都剔除。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-30 09:33:12
南南数据 发表于 2015-4-29 17:50
试着剔除极端值看看,把均值3个或2.5个标准差之外的数据都剔除。
试过这个方法,好像不行,原始数据长得偏态且巨齿状分布
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群