全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1715 1
2015-02-11
许多SAS统计过程在建立模型时要求所有模型变量为数字变量。当涉及众多的变量的水平数和交叉项的时候, 分类变量的参数化过程将变得非常繁琐。 在以下我针对在NLMIXED procedure modelling binomial distribution (非线性二项模型)的构建来展示其中的方法和技巧.
值得注意的是程序过程也许不是非常直观. 比如说,四个分类变量分别包含4, 2, 2, 和3个水平。那么所有的变量组合是179个。如果除掉参考水平,剩下47个。在这里运用参考水平方式(reference), 而不是GLM的形式,其原因为nlmixed过程并不像其他过程那样,可以准确地鉴别出那些多余的参考水平值。
我在程序的最后补充给出计算该组合数的程序。整个程序最终将给出这47个变量外加上截距的模型表达式。即为:y=b1*intercept + b2*x1 + ... + b48*x48.

Read sample here

京剧


http://blog.sina.com.cn/s/blog_a3a926360102vcy5.html


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-2-12 01:35:11
more: the automatically generated formula for modelling in NLMIXED =

Y~
b1*col1+b2*col2+b3*col3+b5*col5+b7*col7+b9*col9+b13*col13+b15*col15+b17*col17+b21*col21+
b25*col25+b29*col29+b37*col37+b38*col38+b39*col39+b41*col41+b42*col42+b43*col43+b45*col45+
b46*col46+b47*col47+b53*col53+b54*col54+b55*col55+b61*col61+b62*col62+b63*col63+b69*col69+
b70*col70+b71*col71+b84*col84+b85*col85+b86*col86+b92*col92+b93*col93+b94*col94+b100*col100+
b101*col101+b102*col102+b116*col116+b117*col117+b118*col118+b132*col132+b133*col133+b134*col134+
b146*col146+b147*col147+b148*col148

JingJu
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群