全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1854 5
2010-07-13
我想做一个相关分析,下面数据是调查问卷得出的
数据如下:
收入            自主经营收入   工资收入  总人数
1.5万以下          14                  25         29
1.5万-3万           7                   18          27
3万-5万             12                  25         27
5万及以上          13                 9           16
解释一下:比如第一行,收入在1.5万以下的一共有29份问卷,有14份通过自主经营收入获得收入,25人通过工资获得收入,即有部分人是同时有经营收入和工资收入。
我这样进行数据处理:
将收入进行赋值:1.5万以下取7500,1.5万-3万,取22500,3万-5万取40000,5万以上取60000,
计算比例,分别用自主经营收入份数除以总人数,比如第一行,14/29=0.4828,扩大1000倍,取整为483,工资收入也同样处理得862。
这样经过初步处理后,获得对应于每个收入水平的,自主经营收入(x1),工资收入(x2)的比例扩大
输入sas中一收入为y值,分别与x1,x2计算相关系数
用相关系数反映 调查对象 自主经营收入 、工资收入 与总收入的关系。。
即收入形式对收入的影响。。
有高手可以回答一下,这样的思路成立吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-7-13 22:09:47
卡方
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-13 22:33:58

llllll
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-13 22:49:44
2# crackman

卡方??

我用corr。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-14 08:09:46
自己顶一下。。求助高手
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-15 14:09:43
补充一下:实际中变量有13个,只是选了其中两个作为例子,因为是做调查问卷得出来的数据,每一收入层,都有不同的人数,不同的收入来源
在问卷中只有是与否两个选项,因此只能统计户数(份数)。。
我的整体思路是想通过计算收入y与具有该收入来源占总人数的比例x的相关系数,来分析某个收入来源是否对于收入有较大影响。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群