全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
12728 47
2009-08-21
Springer经典:Principles and Theory for Data Mining and Machine Learning
(谨作为学习使用,若为他用,后果自负!)


Hardcover: 786 pages Publisher: Springer; 1 edition (July 30, 2009) Language: English ISBN-10: 0387981349 ISBN-13: 978-0387981345
Amazon:http://www.amazon.com/Principles-Machine-Learning-Springer-Statistics/dp/0387981349/ref=sr_1_1?ie=UTF8&s=books&qid=1250838833&sr=1-1

Preface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
1 Variability, Information, and Prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.0.1 The Curse of Dimensionality . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.0.2 The Two Extremes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1 Perspectives on the Curse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.1 Sparsity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.2 Exploding Numbers of Models . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.3 Multicollinearity and Concurvity . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.4 The Effect of Noise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Coping with the Curse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Selecting Design Points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Local Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Parsimony . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3 Two Techniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.1 The Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.2 Cross-Validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4 Optimization and Search . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.4.1 Univariate Search . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.4.2 Multivariate Search . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.4.3 General Searches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.4.4 Constraint Satisfaction and Combinatorial Search . . . . . . . . . . . 35
1.5 Notes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.5.1 Hammersley Points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.5.2 Edgeworth Expansions for the Mean . . . . . . . . . . . . . . . . . . . . . . 39
1.5.3 Bootstrap Asymptotics for the Studentized Mean . . . . . . . . . . . . 41
1.6 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2 Local Smoothers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.1 Early Smoothers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2 Transition to Classical Smoothers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.2.1 Global Versus Local Approximations . . . . . . . . . . . . . . . . . . . . . 60
2.2.2 LOESS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.3 Kernel Smoothers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.3.1 Statistical Function Approximation . . . . . . . . . . . . . . . . . . . . . . . 68
2.3.2 The Concept of Kernel Methods and the Discrete Case . . . . . . . 73
2.3.3 Kernels and Stochastic Designs: Density Estimation . . . . . . . . . 78
2.3.4 Stochastic Designs: Asymptotics for Kernel Smoothers . . . . . . 81
2.3.5 Convergence Theorems and Rates for Kernel Smoothers . . . . . 86
2.3.6 Kernel and Bandwidth Selection . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.3.7 Linear Smoothers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
2.4 Nearest Neighbors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
2.5 Applications of Kernel Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
2.5.1 A Simulated Example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
2.5.2 Ethanol Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
2.6 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3 Spline Smoothing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.1 Interpolating Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.2 Natural Cubic Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
3.3 Smoothing Splines for Regression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
3.3.1 Model Selection for Spline Smoothing . . . . . . . . . . . . . . . . . . . . 129
3.3.2 Spline SmoothingMeets Kernel Smoothing . . . . . . . . . . . . . . . . 130
3.4 Asymptotic Bias, Variance, and MISE for Spline Smoothers . . . . . . . . . 131
3.4.1 Ethanol Data Example – Continued . . . . . . . . . . . . . . . . . . . . . . . 133
3.5 Splines Redux: Hilbert Space Formulation . . . . . . . . . . . . . . . . . . . . . . . . 136
3.5.1 Reproducing Kernels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
3.5.2 Constructing an RKHS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
3.5.3 Direct Sum Construction for Splines . . . . . . . . . . . . . . . . . . . . . . 146。。。。。。

推荐我发的的另外两本书:
1、Data Preparation for Data Mining [并非Using SAS]    By Dorian Pyle  (the Morgan Kaufmann Series in Data Management Systems)
详细网页:http://www.pinggu.org/bbs/viewthread.php?tid=529909&page=1&from^^uid=130869

2、Introduction to Data Mining and its Applications by S. Sumathi
详细网页:http://www.pinggu.org/bbs/viewthread.php?tid=529918&page=1&from^^uid=130869
附件列表

principles_and_theory.rar

大小:8.08 MB

只需: 1 个论坛币  马上下载

本附件包括:

  • SSS-Principles and Theory for Data Mining and Machine Learning-20090721.pdf

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-8-21 15:46:25
好贵。。。。。
而且,是英文的吗?有中文版吗。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-8-21 15:54:28
没有,没有人翻译吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-8-21 16:21:47
这种东西要到有中文版
还需要时间啊
将就看英文吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-8-21 20:45:15
thanks for sharing this book
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-8-21 22:43:14
idiosyncrasy of the book is good for us
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群