全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
2009-6-18 20:43:32
标准化系数的作用是剔除了由于量纲不同而变化的缺点,消除了数量级不同而造成的误差,缺点是剔除量纲使方程抽象。我认为当数据量纲不同,或者数量级相差很大时,采用标准化系数,当量纲以及数量级对数据回归分析准确性影响不大的情况下,或对具体对象分析时,采用非标准化系数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-18 21:33:02
标准化系数是自变量和因变量进行标准化后建立的回归方程,一方面代替了量纲不同带来的变化,另一方面有利于消除变量的数量级不同带来的误差,标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化。
由于标准化后式子中没有常数项,所以非标准化系数用于常数项的检验。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-18 22:47:25
数据经过标准化之后,均变换为均值为0、方差为1的数据。标准化后不同样本的观测值的比较只有相对意义,没有绝对意义。
数据标准化之后,有利于剔除量纲不同而变化系数的缺点,有利于消除数量级的不同代来的误差,但是数据标准化之后没有了量纲,就不如非标准化的数据那么直观的看出自变量变化一个单位,因变量随之变化的实际意义。个人认为数据要不要标准化与常数项能否通过检验没有关系,数据要不要标准化视实际情况而定。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-19 22:54:45
标准化是去除纲量的,标准化前的数据单位不同数量级也不同,标准化后便没有纲量的影响了。对于常数项的检验,那一定是非标准化的(标准化的式子中没有常数项)所以非标准化系数用于常数项的检验。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 11:19:47
标准化与否,是数据的标准化。标准化只是为了消除量纲的影响,对于常数项的检验,那一定是非标准化的(标准化的式子中没有常数项),与是否通过检验没有关系。标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化。由于标准化后式子中没有常数项,所以非标准化系数用于常数项的检验.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 11:57:03
两个都可以,但一般都用非标准化的,因为标准化后是消除纲量的影响,数据的模糊性比较大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 12:18:33
1# jeffzhaolan
两个都可以,但一般都用非标准化的,因为标准化后是消除纲量的影响,数据的模糊性比较大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 12:19:25
1# jeffzhaolan
两个都可以,但一般都用非标准化的,因为标准化后是消除纲量的影响,数据的模糊性比较大。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 12:29:13
标准化主要是为了去除纲量,对于常数项的检验,那一定是非标准化的(标准化的式子中没有常数项),与是否通过检验没有关系。
标准化回归系数在多元回归中被用来比较变量间的重要性。但是由于重要性这一词意义的含糊性,这一统计常被误用。
  有时人们说重要性,是指同样的条件下,哪一个东西更有效。在提高教学质量上,是硬件条重要还是师资更重要?如果是师资更重要,那么同样的物力投在师资上就可以更快地提高教学质量。但是这里要比较的两者必须有同样的测量单位,如成本(元)。如果变量的单位不同,我们不能绝对地说那个变量更重要。不同单位的两个东西是不能绝对地比出高低轻重来。要想进行绝对地比较,就需要两个东西有着共同的测度单位,否则无法比较。
  而标准化回归系数说的重要性则与上面的意义不同,这是一种相对的重要性,与某一特定的情况下,自变量间的离散程度有关。比如说,虽然我们不能绝对地说出教育和年资在决定收入上那一个一定是重要的,但如果现在大家的教育程度比较相似,那么在收入的决定上,工作年数就是决定因素;反之,如果工作年数没有太大区别,那么教育就成为了重要原因。这里的重要性是相对的,是根据不同情况而改变的。再举一个通俗的例子,研究者研究的是遗传因素和后天因素对于人成长的影响。那么在一个社会境遇悬殊巨大的环境中,有人在贫民窟成长,有人在贵族学校上学,那么我们会发现人格的大部分差异会从后天环境因素得到解释,而遗传的作用就相对较小;相反,如果儿童都是在一个相差不大的环境中长大的,你会发现,遗传会解释大部分的人格差异。这种意义上的重要性,不仅与这一自变量的回归系数有关系,而且还与这个自变量的波动程度有关系:如果其波动程度较大,那么就会显得较为重要;否则,就显得不太重要。标准化回归系数正是测量这种重要性的。从标准化回归系数的公式 中也可看出,Beta值是与自变量的标准差与成正比的,自变量波动程度的增加,会使它在这一具体情况下的重要性增加。
  但是如果将两种重要性混同,就会得到误导性结论。如环境因素的Beta值比遗传因素的Beta值大,就认为在个体的人格发展上应更注意环境因素,而轻视遗传因素,在目前对于Beta值的错误观念非常流行,甚至是一些高手中。
  标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化。举例来说,从某一次数据中得出,在影响人格形成的因素中,环境因素的Beta值比遗传因素的Beta值大,这只能说明数据采集当时当地的情况,而不能加以任何不恰当的推论,不能绝对地不加任何限定地说,环境因素的影响就是比遗传因素大。事实上,如果未来环境因素的波动程度变小,很可能遗传因素就显得更为重要。数据的情况千差万别,变量的相对重要性也可能完全不同但都符合当时的实际情况。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 16:25:23
标准化的数据可以消除量纲的影响,而非标准化的数据不可以。一般用不是标准化的就可以了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 16:27:18

RE: 关于标准化回归系数

标准化的数据可以消除量纲的影响,而非标准化的数据不可以。一般用没有标准化的就可以了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 17:26:00
standardized coefficients和Unstandardized coefficients应该两个都可以的。
但实际操作中,应该用标准化前的回归系数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 17:37:51
标准化回归系数与某一特定的情况下自变量之间的离散程度有关,标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能会变化,如果是用于实际的计算,应该选用标准化之前的值作为回归系数标准化后去除了纲量的影响,检验常数项,要用非标准化的,因为标准化后式子中常数项没有了,也就不存在检验常数项的问题了。{:2_31:}
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 20:51:31
我们老师上课时讲:

1.标准化主要是剔除了量纲(即单位)的影响,(例:生产原煤的单位是吨,掘进进尺的单位为米),并且可以消除变量数量级的不同而带来的误差,这样得到的回归方程更加精确,使回归方程更易于表达,回归效果更加明显.

2.对于常数项的检验,那一定是非标准化的(标准化的式子中没有常数项),与是否通过检验没有关系。

谢谢,如有错误,请多指教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 22:15:50
(1)、标准化了的系数剔除了由于量纲的不同带来的影响

(2)、其有利于消除由于数量级不同带来的影响。
但是他由于去除了量纲而使数据变得比较抽象,不易理解。

所以我认为当有这些影响因素时,采用标准化系数较好,而没有这些影响因素时可以采用非标准化系数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 22:18:25
标准化回归系数:其实就是消除了因变量y和自变量x1,x2,…xn所取单位的影响之后的回归系数,其绝对值的大小直接反映了xi对y的影响程度。另外,标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化,所以大家在用的时候要注意相应的环境分析。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 23:15:37
标准化是去除纲量的(比如生产原煤的单位是吨,掘进进尺的单位为米,不光单位不同数量级也是不同的,标准化后便没有纲量的影响了。)
常数项通不通过检验,都是用标准化前的,因为标准化后常数不就变成0了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 23:16:28
标准化系数是为了取出量纲的
非标准化系数可以用于常数项的检验
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-21 23:17:57
一般比较多个变量,我们是尽量假设他们具有相同的刻度分化的。如果要精确地考虑,如果变量的单位不同,我们不能绝对地说那个变量更重要。不同单位的两个东西是不能绝对地比出高低轻重来。要想进行绝对地比较,就需要两个东西有着共同的测度单位,否则无法比较。
而标准化回归系数说的重要性则与上面的意义不同,这是一种相对的重要性,与某一特定的情况下,自变量间的离散程度有关。标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化。
另外,变量单位的变化会导致非标准化的变量回归系数改变,但其标准化的回归系数就会保持不变,也同样可以说明这个问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-22 22:58:57
我认为标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化。如果用非标准系数得到结论,是有偏差的,因为此时的自变量的数据已经发生了变化。 不知道楼主您是否满意……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-5 00:28:00
标准化回归系数(Beta值)在多元回归中被用来比较变量间的重要性
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-12-9 10:17:16
如何将非标准化的系数转化为标准化?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-12-9 14:56:32
学习了 。。。。。谢谢啦楼主
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-3-21 16:50:39
诺诺icey 发表于 2009-6-10 16:51
使用标准化回归系数,可以消除自变量各单位之间的相互影响作用当需要比较多个自变量对因变量相对作用大小时,可以采用标准化回归系数,当我们只是想解释自变量对因变量的作用时,可以采用非标准化回归系数
说的好!简明扼要 呵呵
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-5 14:26:40
关于标准化问题,在比较各变量对因变量的贡献程度或想消除因为变量级别不同而带来的误差时时,最好标准化;但是标准化以后变量失去了量纲,使实际意义不明想。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-5 15:42:55
标准化的回归系数是把该自变量映射到一个例如说0~1的区间里头,把因变量也这样映射过去,也就是说让二者的关系在类似说同一个数量级上,因而标准化的回归系数不会因为自变量或者因变量的单位的变化而变化,而未标准化的回归系数会因为单位的变化而变化。如果是用回归的数据来拟合方程的话,需要用未标准化的回归系数来写你的模型哦~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-5 16:51:05
进来学习一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-19 20:31:24
标准化回归系数考察的是自变量与因变量相关程度的大小,无实际意义;而非标准化回归系数考察的是自变量与因变量实际的相关系数,即用非标准化回归系数建立的回归方程即可通过自变量求的因变量的实际值
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-20 22:30:57
当你需要列出回归方程时,你需要用到的是非标准化的回归系数。当你需要比较哪一个自变量对因变量的影响更大时,你需要用标准化的回归系数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-22 09:43:38
帮你顶一下,我不是很清楚,也是学习的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群