假设你接受了一份暑期工作,在当地的Magic Hill游乐园给男性成人游客猜体重。如果你对他们体重的猜 测误差不超过7kg,则由游客将付给你2美元,而当误差达到或超过7kg时,你就要给游客一个小奖品,每 个奖品都是你在Magic Hill花3美元买来的。幸运的是,Magic Hill游乐园友善的经理在游客背后的墙壁作 了一些高度标记,使你能够准确的测量出游客的身高。不幸的是,在你和游客之间有一堵150cm高的墙, 因此,除了身高和(通常还有)性别外,你无法得到游客更多的信息。你第一天的工作表现得如此之差 ——辛苦工作一整天却亏损了2美元,于是在第二天,你决定搜集数据(请见身高数据)进行回归,用于 估计身高和体重与性别之间的关系。因为大部分的参与者都是男性,你决定将你的样本局限于男性。你 假设如下的理论关系:yi = β1xi +β2 +ei,其中yi为第i个游客的体重(kg为单位),xi为第i个游客的身高 (cm为单位),ei为第i个游客的随机误差项。
31. 身高和体重之间理论相关关系是 相关。
32. 以数据集中的前50个(包括第50个)观测单位估计基础模型,得到的可决系数为 ; 在5%的水平上男性的身高是否能解释他们体重? 。
33. 续上题,样本数据中身高和体重之间的相关关系与理论预期是否一致 。
4
34. 利用数据集中的前50个观测单位,采用教材介绍的White检验来检验模型是否存在异方差时,得到的P值 为 (保留4位小数),给定5%显著水平下可认为模型误差项 异方差。
35. 有人认为“身高每增加1cm,体重至少增加5kg”,请利用利用数据集中的前50个观测单位,以此为原假设 进行检验,得到检验P值为 (保留4位小数),在5%水平下你是否同意此身高与体重的关 系 。
36. 假若现另有50个观测单位(见表1中的第51到第100),根据模型利用数据集中的前50个观测单位的估计结 果,来推测这50个人的体重,你将收益 美元。
| | | | |
| y | x1 | x2 | |
| 9.46 | 2.88 | 5.34 | |
| 10.15 | 2.63 | 2.88 | |
| 10.15 | 3.40 | 3.84 | |
| 12.81 | 3.90 | 2.37 | |
| 11.43 | 3.61 | 1.71 | |
| 8.82 | 2.51 | 4.58 | |