全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
30612 184
2009-06-26
共享Multivariate Statistics with R(2009新书)绝对是好书!
Paul J. Hewson
March 17, 2009

1 Multivariate data 1

2 Matrix manipulation 11

3 Measures of distance 33
3.1 Mahalanobis Distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.1 Distributional properties of the Mahalanobis distance . . . . . . . . . . . . . 35
3.2 Definitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3 Distance between points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3.1 Quantitative variables - Interval scaled . . . . . . . . . . . . . . . . . . . . . 38
3.3.2 Distance between variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3.3 Quantitative variables: Ratio Scaled . . . . . . . . . . . . . . . . . . . . . . 42
3.3.4 Dichotomous data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.5 Qualitative variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3.6 Different variable types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4 Properties of proximity matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4 Cluster analysis 51
4.1 Introduction to agglomerative hierarchical cluster analysis . . . . . . . . . . . . . . . 54
4.1.1 Nearest neighbour / Single Linkage . . . . . . . . . . . . . . . . . . . . . . . 54
4.1.2 Furthest neighbour / Complete linkage . . . . . . . . . . . . . . . . . . . . . 55
4.1.2 Furthest neighbour / Complete linkage . . . . . . . . . . . . . . . . . . . . . 55
4.1.3 Group average link . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.1.4 Alternative methods for hierarchical cluster analysis . . . . . . . . . . . . . . 58
4.1.5 Problems with hierarchical cluster analysis . . . . . . . . . . . . . . . . . . . 59
4.1.6 Hierarchical clustering in R . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2 Cophenetic Correlation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3 Divisive hierarchical clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4 K-means clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.4.1 Partitioning around medoids . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.4.2 Hybrid Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.5 K-centroids . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5 Multidimensional scaling 71
5.1 Metric Scaling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.1.1 Similarities with principal components analysis . . . . . . . . . . . . . . . . . 73
5.2 Visualising multivariate distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.3 Assessing the quality of fit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.3.1 Sammon Mapping . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6 Multivariate normality 79
6.1 Expectations and moments of continuous random functions . . . . . . . . . . . . . . 79
6.3 Multivariate normality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6.5.1 R estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.6 Transformations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
7 Inference for the mean 85
7.1 Two sample Hotelling’s T2 test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.2 Constant Density Ellipses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.3 Multivariate Analysis of Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

8 Discriminant analysis 95
8.1 Fisher discimination . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
8.2 Accuracy of discrimination . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.3 Importance of variables in discrimination . . . . . . . . . . . . . . . . . . . . . . . . 99
8.4 Canonical discriminant functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
8.5 Linear discrimination - a worked example . . . . . . . . . . . . . . . . . . . . . . . . 100

9 Principal component analysis 101
9.1 Derivation of Principal Components . . . . . . . . . . . . . . . . . . . . . . . . . . 103
9.1.1 A little geometry . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
9.1.2 Principal Component Stability . . . . . . . . . . . . . . . . . . . . . . . . . 108
9.2 Some properties of principal components . . . . . . . . . . . . . . . . . . . . . . . . 110
9.8 Illustration of Principal Components . . . . . . . . . . . . . . . . . . . . . . . . . . 112
9.8.1 An illustration with the Sydney Heptatholon data . . . . . . . . . . . . . . . 112
9.8.2 Principal component scoring . . . . . . . . . . . . . . . . . . . . . . . . . . 113
9.8.3 Prepackaged PCA function 1: princomp() . . . . . . . . . . . . . . . . . . 114
9.8.4 Inbuilt functions 2: prcomp() . . . . . . . . . . . . . . . . . . . . . . . . . 115
9.9 Principal Components Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
9.10 “Model” criticism for principal components analysis . . . . . . . . . . . . . . . . . . 117
9.10.1 Distribution theory for the Eigenvalues and Eigenvectors of a covariance matrix118
9.13 Sphericity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
9.15.1 Partial sphericity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
9.22 How many components to retain . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
9.22.1 Data analytic diagnostics . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
9.23.1 Cross validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
9.23.2 Forward search . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
9.23.3 Assessing multivariate normality . . . . . . . . . . . . . . . . . . . . . . . . 138
9.25 Interpreting the principal components . . . . . . . . . . . . . . . . . . . . . . . . . 141
9.27 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

10 Canonical Correlation 143
10.1 Canonical variates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
10.2 Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
10.3 Computer example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
10.3.1 Interpreting the canonical variables . . . . . . . . . . . . . . . . . . . . . . . 147
10.3.2 Hypothesis testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

11 Factor analysis 149
11.1 Role of factor analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
11.2 The factor analysis model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
11.2.1 Centred and standardised data . . . . . . . . . . . . . . . . . . . . . . . . . 152
11.2.2 Factor indeterminacy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
11.2.3 Strategy for factor analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
11.3 Principal component extraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
11.3.1 Diagnostics for the factor model . . . . . . . . . . . . . . . . . . . . . . . . 158
11.3.2 Principal Factor solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
11.4 Maximum likelihood solutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
11.5 Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
11.6 Factor scoring . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
附件列表

Multivariate Statistics with R.pdf

大小:1.14 MB

只需: 5 个论坛币  马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-6-26 17:56:54
好东西!!!我们都来顶个一个吧!好人好书!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-26 18:01:09
跟顶,非常感谢(/^0^)/~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-26 20:50:29
感谢分享!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-26 22:52:35
谢谢分享{:2_25:}
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-6-26 23:31:17
已下载!谢谢分享!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群