全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
3690 0
2020-10-09
CDA人工智能学院致力于以优质的人工智能在线教育资源助力学员的DT职业梦想!课程内容涵盖数据分析机器学习深度学习人工智能tensorFlowPyTorch知识图谱等众多核心技术及行业案例,让每一个学员都可以在线灵活学习,快速掌握AI时代的前沿技术。PS:私信我即可获取《银牌会员》1个月免费试听机会

在数据处理的时候,一般来说数据都是正态分布的,按照正态分布的性质,三个标准差以外的数据都,可以被看作是错误的数据从而排除掉,现在跟大家分享一下如何根据标准差来筛选数据。

方法/步骤
要想按照标准差筛选数据,必须先要求出每个数据的Z分数,如图所示,在菜单栏上执行analyze--descriptive statistic--descriptive,打开描述统计对话框

  • 20180812073218_95564.png
  • 将我们要筛选的数据放入到变量对话框中,勾选save standardized values as variables,这样就能输出Z分数了,点击ok按钮,输出结果

    20180812073211_66552.png


  • 我们看到,在数据窗口中多了一列数据,这就是我们求得的z分数,接下来要根据这组数据。来筛选数据

    20180812073205_36435.png


  • 在菜单栏上执行data---select cases,打开数据筛选对话框

    20180812073159_11590.png


  • 我们对case按照标准差进行选择,需要根据条件来选择,所以选择if conditions is satisfied,点击if来设置条件

    20180812073152_47648.png


  • 在这里我们输入公式Zx2  <= 3 & Zx2  >=  -3 ,这个条件的意思就是选择数值在3和-3之间。点击continue按钮,返回到主对话框

    20180812073147_73676.png


  • 在主对话框中,点击ok按钮,开始处理数据

    20180812073141_79035.png


  • 最后我们看一下处理的效果,超过三个标准差的数据在前面都有一个斜杠表示删除了。以后处理数据的时候他们就不参与了

    20180812073135_41228.png



0D04CBB8996CB009643B8D6FD844F0C0.jpg

关注“CDA人工智能学院”,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群