全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5736 2
2014-05-14
原始数据:
应变量Y1.5乘NX2的平方X3方立X4乘以5随机变量*10

282.5875

1.5

9

216

50

5.534079

434.0978

3

25

343

55

7.361607

609.1678

4.5

25

512

60

6.970693

828.8728

6

25

729

65

3.520751

1105.339

7.5

25

1000

70

2.580645

1449.579

9

25

1331

75

8.708448

1848.852

10.5

25

1728

80

4.865819

2320.52

12

25

2197

85

1.381491

2879.539

13.5

25

2744

90

6.399039

3520

15

25

3375

95

9.090829

4244.503

16.5

25

4096

100

6.366745

5064.147

18

25

4913

105

2.861074

5987.367

19.5

25

5832

110

0.788023

7029.596

21

25

6859

115

8.723905

8149.154

22.5

1

8000

120

5.140222

9415.76

24

4

9261

125

1.599975

10816.93

25.5

9

10648

130

4.024562

12348.85

27

16

12167

135

3.50299

14021.8

28.5

25

13824

140

3.90479

15840.46

30

36

15625

145

4.053713

17807.17

31.5

49

17576

150

0.605066

19942.22

33

64

19683

155

6.566586

22230.6

34.5

81

21952

160

2.817158

24696.23

36

100

24389

165

5.664346

27331.83

37.5

121

27000

170

3.029229

30159.3

39

144

29791

175

9.361317

33166.78

40.5

169

32768

180

8.437123

430.2037

42

196

1

185

5.639743

476.9701

43.5

225

8

190

9.518252

532.3043

45

256

27

195

8.458426

604.0538

46.5

289

64

200

4.139817

507.7341

48

324

125

5

5.212815

645.8374

49.5

361

216

10

8.488565

811.6826

51

400

343

15

2.438691

1031.835

52.5

441

512

20

5.758993

1297.463

54

484

729

25

4.966605

1624.212

55.5

529

1000

30

8.8293

2001.971

57

576

1331

35

2.701173

2452.424

58.5

625

1728

40

0.839814

2986.356

60

676

2197

45

7.59617

3588.732

61.5

729

2744

50

3.847505

4281.325

63

784

3375

55

3.931412

5062.03

64.5

841

4096

60

0.481662

5947.817

66

900

4913

65

3.470335

6931.725

67.5

961

5832

70

1.113991

8033.111

69

1024

6859

75

5.555591

9247.116

70.5

1089

8000

80

6.923231

10579.12

72

1156

9261

85

4.650132

12039.4

73.5

1225

10648

90

2.639015

13639.16

75

1296

12167

95

5.599967

15370.76

76.5

1369

13824

100

1.146659

17252.51

78

1444

15625

105

0.465599

19293.01

79.5

1521

17576

110

5.921453

21489.53

81

1600

19683

115

9.571739

23844.06

82.5

1681

21952

120

7.782054

26371.63

84

1764

24389

125

8.757356

29067.06

85.5

1849

27000

130

2.327563

31949.22

87

1936

29791

135

0.19593

35027.35

88.5

2025

32768

140

5.321699

38297.53

90

2116

35937

145

8.66565

读入后的:

> head(data)
          y  x1 x2   x3 x4       x5
1  282.5875 1.5  9  216 50 5.534079
2  434.0978 3.0 25  343 55 7.361607
3  609.1678 4.5 25  512 60 6.970693
4  828.8728 6.0 25  729 65 3.520751
5 1105.3387 7.5 25 1000 70 2.580645
6 1449.5793 9.0 25 1331 75 8.708448


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-12-10 18:45:56
你这也没分析啊,就是用head命令把前6行输出出来了。你是说你用广义加性模型gam——
   
gam(formula,family=gaussian(),data=list(),weights=NULL,subset=NULL,
    na.action,offset=NULL,method="GCV.Cp",
    optimizer=c("outer","newton"),control=list(),scale=0,
    select=FALSE,knots=NULL,sp=NULL,min.sp=NULL,H=NULL,gamma=1,
    fit=TRUE,paraPen=NULL,G=NULL,in.out,...)




1. formula:GAM的公式
2. family:服从的分布
3. data:所需的一个数据框或列表包含模型响应变量,协变量
4. weights:现有的数据上的权重
5. subset:可以使用的观测值的一个子集。
6. na.action:一个函数,它表示时会发生什么数据包含“NA”。
7. offset:模型偏移量
8. control:控制参数,以取代默认值返回gam.control
9. method:平滑参数估计方法
10. optimizer:指定的数值优化方法
11. scale:如果这是正的,尺度参数;负的,规模参数未知。 0说明是泊松分布和二项分布和未知的,否则,尺度参数为1。
12. select:如果这是TRUE然后gam可以添加一个额外的惩罚变量,以每学期,以便它可以被扣分零。这意味着平滑参数估计是拟合的一部分的,可以完全除去从模型中的条款。如果相应的平滑参数估计值为零,那么额外的惩罚没有任何效果。


下面是一个例子——

Family: gaussian
Link function: identity


Formula:
y ~ s(x0) + s(x1) + s(x2) + s(x3)


Parametric coefficients:
            Estimate Std. Error t value Pr(>|t|)     #线性变量的回归系数和显著性检验结果
(Intercept)  7.83328    0.09878    79.3   <2e-16 ***


p值<0.05,没有通过原假设,有显著的统计意义。

---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Approximate significance of smooth terms: #曲线拟合的结果
        edf          Ref.df      F  p-value   
s(x0) 2.500  3.115  6.921 0.000128 ***
s(x1) 2.401  2.984 81.914  < 2e-16 ***
s(x2) 7.698  8.564 88.029  < 2e-16 ***
s(x3) 1.000  1.000  4.343 0.037806 *  

p值<0.05,没有通过原假设,有显著的统计意义。
理论上,当自由度接近1时,表示是线性关系;当自由度比1大,则表示为曲线关系。
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


R-sq.(adj) =  0.715   Deviance explained = 72.5%
GCV = 4.0505  Scale est. = 3.9027    n = 400

R-sq.(adj) :调整R方
GCV是:广义交叉验证法

Deviance explained:解释偏差



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-17 19:08:29
同问,做了广义加性模型拟合,但里面太多结果不会分析。请教。
Ref.df  是什么意思
另外,连接函数要怎么样才能找出来
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群