书名:Sparse Modeling Theory, Algorithms, and Applications
出版社:Chapman & Hall/CRC
所属类别:Machine Learning & Pattern Recognition Series
页数:250页
格式:pdf
是否高清:高清原版
推荐理由:该书是一本讲述稀疏学习理论的书籍,属于统计学与机器学习的范畴。是最近10多年开始流行的一大类方法。是目前大数据环境下非常重要的一类方法,与深度学习,增强学习同样流行的一大类方法。那么什么是稀疏模型呢,拿回归模型举个例子,简单的说就是让部分回归系数变为0的方法,比如影响因变量y的自变量x可能有几百个或者上千个如x1,x2,x3,...x1000,我们想要寻找对y有显著影响的自变量,传统的方法是通过观察自变量回归系数的显著性水平来判断,而稀疏学习方法可以直接让所有的回归系数变为两大类,一大类是0,另一大类是非0的,非0的我们就认为对y有显著性影响,可以看出来稀疏学习让一部分稀疏变为0了,也就是达到了稀疏的效果。那么这种方法和传统方法比的独特优势是,它可以处理小N大P型数据,就是样本可能只有几十个,但是x的维度确实非常大。传统方法无法有效处理这种数据,而稀疏学习可以解决。我这里只是简单说一下大致思想,并不严谨,稀疏学习是一大类方法,涉及到机器学习的方方面面,大家可以深入学习。
我们经常看到的lasso回归就是典型的稀疏模型。具体大家可以参考这本书,还有一本稀疏学习的专著《Statistical Learning with Sparsity The Lasso and Generalizations》作者就是稀疏学习lasso理论的创立者,大家也可以拿来看看。《Sparse Modeling Theory, Algorithms, and Applications》这本书范围更加广一些。两本书都非常好。
大家如果对数据挖掘感兴趣,这本书一定要好好看看,涉及地理论也非常深。
因此真诚把这本书推荐给大家。