紧急求助：关于统计的一些简单问题（SPSS）

2005-1-31 20:23:00

还有个小问题，由于总体数剧中有某一元素的离散度过高，导致到解释力度的降低，或者是说REGRESSION结果不满意，能否对数据组中的某一元素进行数据的分布，比如只取起 2*Standard Deviation 间的值？比如说，我的数据中包括了以下元素

ROE, ROA, MBV, TobinQ, DA, LnAsset, etc.

其中ROE的离散度较高，希望能对ROE进行处理，把数据中ROE超过 MEAN ROE+/- 2*STD的数据排除，然后再进行 regression analysis, 可以这样做么？如果可以的话，请问如何在SPSS中实现。。。谢谢！！！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-1-31 23:27:00

希望有能者助之

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 00:34:00

Question: 我的数据中包含了几个DUMMY VARIABLE，不知道在SPSS中如何进行DUMMY的定义。

The following program places dummy variables in an hourly format in SPSS.

DATA LIST LIST /caseid(F8) start(F8.2) end(F8.2). BEGIN DATA. 1 0710 0730 1 0805 0900 2 0650 0759 3 0925 1010 3 0605 0805 4 0730 0735 5 0724 0800 6 0552 0910 7 0759 0859 8 0800 0859 9 0800 0900 10 0759 0859 END DATA. LIST.

COMPUTE s=TRUNC(start/100)-.1. COMPUTE e=TRUNC((end+1.1)/100)+.1. VECTOR v(24). LOOP #cnt=1 TO 24. COMPUTE v(#cnt)=RANGE(#cnt,s,e). END LOOP. EXECUTE.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 00:43:00

Question: 如何进行分类对比，或者是按某一数据的上下25%进行对总体数据进行分类对比

MEANS AS SUMMARIES OF DISTRIBUTIONS

It is often useful to examine means or averages of a variable according to categories of other variables, such as education. When we do this, we should have some statistical model or hypothesis in mind.

In this example, using the data set IMMUNR.SAV, we wish to confirm the expected result that on average older children will have older mothers than younger children. We do this by examining whether the mean age of mothers will be older for older children than for younger children. The variable for which the mean is calculated must be an interval variable (or possibly a dichotomous variable with values of 0 and 1) if the calculation is to be meaningful.

Exercise E.1

Open the data set IMMUNR.SAV. Request the mean age of mothers for each age category of youngest child:

MEANS TABLES=AGE BY AGECYC.

The output looks like the following display.

You can see that the mean age of the mothers of the youngest category of children is 26.5 years, while the mean age of mothers for the oldest children is 36.2 years. This agrees with our expectation.

We also know that as education for women has increased rapidly in Indonesia in the past 20 or so years, so older women, on average, are less educated than younger women. This should mean that the average age of less educated women is expected to be higher than the average age of more educated women.

Exercise E.2

Calculate means for age of mother according to education of the mother:

MEANS TABLES=AGE BY EDUCR.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

http://www.bioon.com/biology/Class45/spss/200407/55159.html

2005-2-1 00:58:00

Question: 如何进行分类对比，或者是按某一数据的上下25%进行对总体数据进行分类对比

Answer:

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

2005-2-1 01:12:00

谢谢楼上的大虾！我想可能我在第一个问那里没有很清楚的说明白，也不是很懂SYNAX的用法，我是想请教在SPSS11。5中有没有什么选项可以对N》1的DUMMY 进行定义，因为如果N《1的话，直接就可以把DUMMY代入REGRESSION就可以了，但我在朋友的分析中看到了可以对DUMMY（N》5）的REGRESSION ANALYSIS下对每个DUMMY（D0， D1，D2，ETC）有独立的BETA出来，不知道如何可以做到，谢谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 01:49:00

I am a layman, all the stuff I posted is just for your reference!

It seems:

>SPSS

>Compute

>If

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 05:43:00

Sorry, I am in a rush~

Thanks a lot~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 11:11:00

b960450:

1：在数据中有男女之分，如何进行分类对比?可以利用crosstabs进行分析！

2：关于虚拟变量，完全可以用transform-recode进行设置

3：对数据进行筛选，可以用data-select cases进行筛选.

4:若涉及回归方程，不仅要进行t，F检验，而且还要进行异方差诊断与检验，异常值识别，正态行性检验，多重共线性检验等，只有这些都没问题了，用回归方程在统计上是没问题的，但还要考虑经济和实际的意义。

以上只是个人观点，仅供参考！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 11:39:00

..呵呵，关于D 我只大概知道共线性，不过有关金融类的数据，我的样本中，CONTROLL VARIABLE的共线性情况比较严重，也直接导致了MODEL的解释度过低， R2 = 0.6xx 其中对我想要观测的变量也没有很好的BETA值（SIGNIFICATE）

如何可以解决这样的问题？比如说，我的控制变量中有Debt/Asset, Ln Asset, Ln Sales, Fst, Fst^2, 其中有几个是有很强的共线性（关联度很高），但不放入MODEL的话，理论上又不流畅，因为这些FACTORS对我的DEPENDENT VARIABLE都有影响。

我是希望通过CONTROL 负债率，资本回报率，规模（LN SALES/ LN ASSETS）, 行业，上市地点，股本集中度等因素，来观测国有股份/法人股对与Market - Book Value / Tobin' Q Ratio的影响，但这几个CONTROL VARIABLE 又关联度很高，在这样的情况下，该用什么做分析？(spss 中）。。

还有一个问题，直接影响到模型的，就是我是否该把 Fraction of State Share (FST)　和 Fraction of Legal Person Shares（FLP)放在一个方程中，还是该单独列开？　(1= FST + FLP +FTA) FTA is fraction of tradable share, 其中 FST 和 FLP 的关联度很高，能否放在一个方程中，　还是该分开衡量？　我观测的目的是希望证实

１。　股本结构和 MBV or Tobin Q 有关联，　（这个我用Correlate来看，　但不显著，因为ＭＢＶ和ＴＯＢＩＮ　Ｑ受其他因素影响）

２。　ＦＬＰ，ＦＳＴ影响到了MBV/Tobin Q 这里我假设了FLP, FST是Exdogenous,外生的。

不好意思，我对计量经济学不是很熟悉～

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 11:43:00

b960450:

1：在数据中有男女之分，如何进行分类对比?可以利用crosstabs进行分析！

我试过用ＧＲＯＵＰ的方法去解决关于男女分组这样的问题，但效果不好，因为直接就进行对比了，没和总体效果比较，这样不是我想做地。

ＣＲＯＳＳＴＡＢＳ我等会也去试试：）　谢谢了！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 12:00:00

数据样本已经贴上了，希望有能者帮忙看一下

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 13:48:00

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 16:09:00

我大致浏览过你的数据及结果，从你的结果中你主要是用回归模型,采用的方法是默认的方法:enter!还作了简单的线性相关性检验！

你数据中的变量q1的标签是proxy q，是指代理变量吗？若是代理变量，应该说明它是个较好的代理变量

多元线性回归模型必须要进行异方差检验，否则一般t检验，F检验慧有问题。

我认为你如果单纯的应用多元线性回归模型，可能得到的结果可能不会较理想！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 16:21:00

解决多重共线，较简单的方法可以用SPSS中的stepwise进行变量选择及回归！当然也可用岭回归（不主张用此方法，因为不是无偏估计），主成分等方法。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2005-2-1 16:23:00

建议在建立模型前，画scatter，初步判断变量之间是否都是线性关系，若不是，用多元回归是有问题的！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝