全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
3374 10
2020-05-09
悬赏 50 个论坛币 未解决
请问比如有一个定量变量(体重):10,12,15,15,16,17,18,20,23,>90; 就是最大值是一个不确定的数值的时候,怎么在spss里录入(或者说什么描述平均水平、离异程度这些指)? 当样本量小的时候我们还可以手动排排序计算一下(比如P50=16.5),但当样本量大的时候,并且是在spss里的时候应该怎么操作?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-5-10 12:15:23
您所述变量情况,其实隐含意义是,存在一个最大值,且该最大值超过某个临界值后不再具有实际的统计意义。比如说,体重超过90后,不管这个观测值是多少,都可以按90统计。另外一层含义是超过临界值的观测值,其离异程度过大,对变量描述具有不利的影响,一般这类观测值是应该排除的。
我建议直接按临界值设定最大值,并根据实际情况考虑是否排除该值。
操作上可以设定一个临界值,变量的样本观测值出来后,按临界值将最大值或者超过临界值的样本重新赋值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-5-10 12:59:25
llb_321 发表于 2020-5-10 12:15
您所述变量情况,其实隐含意义是,存在一个最大值,且该最大值超过某个临界值后不再具有实际的统计意义。比 ...
你好,你的意思就是(在不排除不确定值的前提下)把不确定的值直接给设成一个确定值来代替是吗?(直接把>90改为90是吗,因为在spss里没不能录入>90这样的类型的数据【在该一列变量为数值型的前提下】)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-5-10 13:04:17
spss里面是有定义缺失值的选项的,有定义(设定)临界值的操作吗? TIM截图20200510130335.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-5-10 15:27:33
问题是如果变量的某个样本观测值不确定的话,统计方法能否实现。您给的视图是在定义变量的取值范围,之后观测值都是在定义的范围内的确定值。可以理解为变量是可变的,但变量的样本值是确定的。那个低和高,是变量范围,超出这个范围的样本值,系统判断输入错误吧。另外一个问题,如果需要大于90的样本按原值参与算法,如果是不确定的值,那么就可能需要引人随机过程,实际上可以理解为确定值构成一个变量,不确定的值构成一个随机变量,共同参与算法。
其实,我也是拍脑袋想的,类似以前用水晶球做风险分析时的做法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-5-10 15:32:58
另外,我们讨论而已,我也是学习。我论坛币足够多,不需要你的币,所以不要给我。要不然,我又得找你的帖子一个个评价还回去,麻烦。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群