全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
59386 11
2009-02-23
<p>我的数据中有些变量非正态分布,描述时是不是就不能用均数、标准差了?是不是一定要用中位数、四分位间距描述?</p><p>我做线形回归分析时是不是要把这些非正态的数据都先转化成正态的才能做呢?我请教了一个同学他说只要原始数据的残差图可以就不用做数据转换,是这样的吗?恳请这里的高手指点一二。谢谢!</p>
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-2-23 23:50:00
补充一下,我用原始数据做的残差图显示绝大部分观测量都在±2的范围内,这样是不是就说明我的原始数据满足线性与方差齐性就不必再做数据转换了呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-25 10:20:00

http://www.cos.name/bbs/read.php?tid=2963

这个对你应该有帮助

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-25 20:57:00
这回长见识了,非常感谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-26 03:55:00

線性回歸有幾個假設條件(書上都有寫,但很多人忽略)

1. 所有殘差項的平均數為0

2. 殘差項的變異數具有齊一性(homogeneity),若非齊一性,則須以WLS方式處理

3. 殘差項與依變數均為常態分配

4. 每個殘差項之共變數為0,若非0,這叫自相關,則須以GLS處理

5. 任何一個殘差項與自變數是無關的,若有相關,則不能以最小平方和方式處理,須以SEM來做

6. x為固定變數,你可以控制,但y為隨機變數,意即常態分布

另外你提及及log轉換,是指x的分佈非常態時

1. 如果是左偏(看尾巴偏在哪一邊),則將x改成x^1/2

2. 如果是右偏,則x改成lnx

3. 若是很平,低濶峰,則x改成1/x

4. 若是很尖,則x改成x^2

統計的操作很簡單,但是關念要瞭解很難,希望上述的說明能回答你的問題

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-3-12 22:37:00
不管什么形状,可以用box-cox变换,把数据变成正态分布的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群