全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
2789 5
2016-04-19
影响制衣厂各工序工时(数值型数据)的因素有:面料(多分类无序变量,分类有100多种),款式(多分类无序变量,分类有7,8种),总件数(数值型变量),班组(多分类无序变量)


现在想达到两个目的:
1.分析各影响因素对工时的影响是否显著,并能看出各因素的影响大小
2,建立多输入(各影响因素),单输出(工时)的模型,要求输入某工序对应的面料,款式等影响因素,即能输出对应工时。

问题:
1,对于第一个问题,我尝试用单因素方差分析来看影响是否显著,但数据不是正态分布,且不能通过方差齐性检验,看了论坛中有些回答,用了非参数检验(秩和检验),这样处理合适吗?应该怎样处理。
2.对于自变量为分类数目较多的多分类无序变量,因变量为数值型变量,一般应该怎样进行数据建模(不一定用SPSS)呢?
3,由于分类数目较多,我是否可以通过聚类分析来减少各自变量的分类数目呢?


对于上述建模要求,请问有什么好的处理分析以及建立模型的方法吗?(非统计专业出身,实在不懂啊)附件为部分数据格式

附件列表
图片1.png

原图尺寸 615.84 KB

图片1.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-4-20 09:58:20
这个问题你应该用多元线性回归去做,单因素方差分析只能验证影响因素是否显著而无法查看大小,同时还有一个弊端,即某一因素单独来说是显著的不等于所有因素都显著,原因由于多重共线或者其它
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-20 15:11:27
gao19891024 发表于 2016-4-20 09:58
这个问题你应该用多元线性回归去做,单因素方差分析只能验证影响因素是否显著而无法查看大小,同时还有一个 ...
多元线性回归在自变量为多分类变量时貌似要进行设置虚拟变量,现在面料这个自变量有100多个分类,也要这样设置n-1个虚拟变量吗?
如果设置虚拟变量进行回归的话,系数是否代表就是该虚拟自变量对因变量的影响大小?那被拆成若干虚拟变量的本来自变量对因变量的贡献大小如何表示呢?
你的意思是否就是用多元线性回归建模呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-21 22:00:50
1.单因子方差分析肯定是不行的因为不符合正态分布也不能用T检验。可尝试用F检验。个人觉得这个数据类型可以用F检验直接实现。
2.考虑多元线性回归。可先进行相关性分析,自变量太多,要剔除。直接做会受多重共线性影响,可考虑岭回归和主成分回归(主成分分析)。
3.可以考虑聚类,也可以考虑因子分析和主成分分析。至于2问模型,回归拟合模型就可以直接实现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-22 15:18:29
你面料有100多类肯定不合适的,用楼上的方式,聚类、因子或主成分分析,将其降维(一般降低为10类以下吧,每类可以根据各类下面有什么细类并结合你的经验再命名,注意每个分类应有较为充足的样本量,如果A类样本量太小,就应该剔除这类的样本)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-5-17 17:28:22
新手来看看 发表于 2016-4-21 22:00
1.单因子方差分析肯定是不行的因为不符合正态分布也不能用T检验。可尝试用F检验。个人觉得这个数据类型可以 ...
不好意思,这个项目由于某种原因搁置了一段时间,现在又要开始:
想问下对于自变量为定类变量,因变量为数值型变量如何进行相关性分析呢,貌似没找到合适的相关系数?
还有就是F检验是方差齐性检验吗?如何判断是否有显著性差异呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群