经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
SPSS论坛
求助:数据缺失很多,标准化处理还有意义吗
楼主
hanfeng20
2049
2
收藏
2015-08-20
网络平台上采集了很多数据,其中某一些指标上的数据缺失很多,都是0.但这些指标部分数据却很大,所以就形成了两个极端。
如图1.
经过SPSS的标准化处理后,由于极端值的存在,很多缺失数据的Z分数都出来,而且相同。(就是被少部分的大数据给影响的),如图2:
,对于这些数据是否就是删除即可?请教各位。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
xddlovejiao1314
2015-8-20 19:15:41
可以考虑将此类指标进行类别化(如大于a将其赋值为1,小于a赋值为0),将其设置为类别变量。然后以虚拟变量的形式纳入模型。祝好运。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
hanfeng20
2015-8-21 11:28:18
大神说的高大上啊。。。(1)其他数据完整的都是连续性变量,这些如果处理为类别变量会影响嘛? (2)缺省数据很多,极端值可能较少。是否可以考虑删除这一个指标?(其实不想删的,但是0太多)。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
SEM分析时数据缺失处理方法有哪些?
关于标准化
负向指标的标准化
怎么预测出缺失的数据
回归 数据缺失
用spss录入hlm生成文件时Y有数据,可是软件说我第一层数据缺失,没有数据
从SPSS导入HLM7的第一层数据缺失了很多
SAS数据缺失问题
数据缺失-多重插补
SPSS读入初始聚类中心成功,运行的时候出现数据缺失怎么办?
栏目导航
SPSS论坛
行业分析报告
Stata专版
国内外文献账号区
爱问频道
求助成功区
热门文章
CDA 数据分析师:特征处理核心指南
电子行业深度报告:量子深潜-计算篇:从比特 ...
制造业全要素生产率(2000-2024年)
从知识图谱到认知智能
2025生成式人工智能在自动驾驶中的应用白皮 ...
中物联:全球供应链发展趋势蓝皮书(2025)
企业降低融资成本白皮书(2025)
2025年最值得关注的公司-放射配体创新者开启 ...
中国能源统计年鉴1986-2023
签个到
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群