经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
SAS专版
统计分析的软件问题
楼主
够dutch
1327
2
收藏
2014-03-28
有哪位大大帮我下,假设一个10*10的数据集,10条观测,10个变量,在是个变量中有些事缺失值,在SPSS软件中如果做统计分析,比如logistic,多重现性什么的SAS使用的观测数还是是、会是10条,似乎是自动做了填补。而如果用SAS分析,只要是在观测中的任意个变量值出现缺失,SAS会忽略掉这条观测,使用的观测数会少于10个,有什么办法可以让SAS像SPSS一样,能使用到所有的观测作分析?谢谢啦
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
intheangel
2014-3-28 14:35:00
应该不同的操作都会有选项来默认是否计算缺失值,最简单的你把所有的缺失都设成0不就好了么
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
bakoll
2015-1-21 21:47:29
SAS中没有专门的处理缺失值的过程步,但是在标准化变量的过程步中可以实现缺失值的填补。其基本过程如下:
PROC STDIZE DATA=dataset REPONLY METHOD= OUT=outdata ;
VAR variables ;
RUN;
其中proc stdize 是调用标准化过程步,data=表示需要进行缺失值填补的数据库,reponly的意思是只取代缺失值(replace missing data only),这个在均数填补法中必须要加上,不然就得不到想要的结果,method=就是选择填补方法,一般在针对计量资料时,我们一般选用均数填补法和中位数填补法(数据符合正态分布时METHOD=mean,偏态分布时选用METHOD=median),在填补计数资料没有什么好的办法,一般也使用中位数填补法,目的是尽量不要出现带小数点的填补项,但是其实使用中位数填补法有可能会产生带小数点的值,那就是当样本量(这里专门指排除缺失值后的样本量)是偶数的时候,打个比方:有一个100例的样本量,缺失2个,那么在这剩下的98个样本量中,中位数=[an/2+ a(n+2)/2]/2,当an/2和a(n+2)/2不相等时则中位数肯定为带小数的值。当然这种情况其实发生的概率很小,特别是大样本以及分类数很小的时候,万一发生了,者只好使用众数填补,即用出现频率最高的频数来填补,要是使用众数填补则不能使用以上的过程步了,目前没有找到很好的方法,只能使用最笨的方法,即使用proc means 过程步求出众数,然后在记录这个数值,在放到data 步中进行填补。
总结一下:在使用sas(目前我用的是SAS9.2版本)进行均数填补法时,先看数据类型(当然这里只针对数值型数据,字符型在这里不做讨论),如果是计量资料,使用均数填补法,过程如下:
PROC STDIZE DATA=dataset REPONLY METHOD=mean OUT=outdata ;
VAR variables ;
RUN;
把dataset改成你要填补的数据库,把outdata改成经过均数填补法填补以后你要保存的数据库名字(如果没有这个语句那么SAS将自动保存,形如data1,data2...),把variables改成你要进行填补的变量。
要是数据类型明显的偏态,则使用中位数填补法,只需把mean改成median就行了。
当数据类型是计数资料时,分两种情况:
1.当数据排除缺失之后的观测值为奇数时,使用中位数填补法,方法同上,
2.如果当数据排除缺失之后的观测值为偶数时,可以使用proc means求一下中位数,如果是整数则可以使用中位数填补法,方法同上,如果不是则使用众数填补法
注意以上方法只适合缺失观测不是很多的情况,如果缺失过多,应该对缺失观测单独进行分析,而不能盲目的进行填补,导致结果偏离很大!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
【下载S】AS统计分析及应用(黄燕)-含有程序和数据
闵应骅:统计分析 无处不在(091110)
我国林业的统计分析
R语言与统计分析(汤银才版)
求几本统计分析的好书
20140615多学科统计分析趋势与性质通用公式(草稿止于20140616)
统计分析
R语言与统计分析
统计分析
统计分析
栏目导航
SAS专版
金融学(理论版)
新手入门区
真实世界经济学(含财经时事)
经管高考
马克思主义经济学
热门文章
精准匹配,菁英相伴--经管之家单身俱乐部, ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
【24重磅,详细,顶刊方法!】2000-2024上市公 ...
【24更新,详细,自用整理!】2000-2024上市公 ...
CDA数据分析师:商业数据分析体系构建的核心 ...
CDA数据分析师:商业数据分析实践的核心执行 ...
Stata 最新外部指令(含Meta-Analysis及DAS ...
Stata MP 17-19.0 永久4核授权码 (19.5版不 ...
Stata 19.0 Win 安装文件
Differences-in-Differences for Natural E ...
推荐文章
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
2026JG学术冬训营:从Stata初高到Python机器 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群