全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
734 5
2022-11-29
我看的各种视频中,都是采用手输数据,然而实际生活中,更多的时候还是导入Excel数据表,这个时候如果需要进行方差检验,该如何定义变量。

比如,有ABCD四家公司,收集消费者的满意度调查问卷,每个公司1000份,满意度为1-5点(数字越高越满意),所有数据以及收集完成,并且初步整理成Excel表格,直接使用界面功能导入了。

大概就是:

A   B   C   D

5  4   2     1

4   5   2    5

省略号……

这种形式。


我看的视频课上,有一个衣料的案例,是看四种材质的衣服在吸收某气体上面有没有显著差异,在建立数据集的时候,新建了一个变量type,然后将四个品牌用赋值语句,然后下面的数值也直接赋值quality了。像我举得这个例子直接默认变量,就是ABCD四个公司,然后每个变量下面对应的1000条数值,这应该如何定义自变量和因变量进行方差检验。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-11-29 19:52:02
将原始数据转置,变更为如下结构:
X    Y
A    5
B    4
C    2
D    1
......
则你的方差分析模型可建立为 Y = aX + b。

要转置数据集,可以用proc transpose,也可以就在 data 步中用赋值+output语句来完成;
要执行方差分析,建议使用proc glm。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-11-29 20:07:21
whymath 发表于 2022-11-29 19:52
将原始数据转置,变更为如下结构:
X    Y
A    5
如果转置之后,A 后面跟着1000条数据呢
结果就是
X  Y
A   5   4 2 4 5 6 3……
B  6 5 7 4 5 2 4 ……
后面的这些数值,可以全部赋值给Y么?
我有想过用频数来让整个表格简洁些,
因为A 下面对应的数值只有1到6这6个数字,能否,输入成A 1 236,即A 变量有1000条数据,然后236条是1
那么应该如何建立这种带频数的数据集?
以及在调用proc glm的时候,如何设定频数
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-11-29 20:45:27
vincent299 发表于 2022-11-29 20:07
如果转置之后,A 后面跟着1000条数据呢
结果就是
X  Y
你当设法使数据变为 n行2列 的形式。
你可以使用freq语句来使用带频数的数据集,试试查询帮助手册中,proc glm下的freq语句的语法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-11-29 21:06:13
whymath 发表于 2022-11-29 20:45
你当设法使数据变为 n行2列 的形式。
你可以使用freq语句来使用带频数的数据集,试试查询帮助手册中,pr ...
非常感谢,希望能看一下私信,有更详细的解释,其实我更希望得到一些分析方向上的意见,
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-11-29 21:15:20
whymath 发表于 2022-11-29 20:45
你当设法使数据变为 n行2列 的形式。
你可以使用freq语句来使用带频数的数据集,试试查询帮助手册中,pr ...
非常感谢,希望能给一些分析方向的指引,能够看一下私信
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群