Pang-Ning Tan, Michael Steinbach and Vipin Kumar, Introduction to Data Mining.
Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques.
前沿教材:
但比较新的还是推荐Stanford课程讲义总结出来的, 课件也很好。跟传统教材相比,更侧重大规模数据处理的一些技术,例如高维数据分析。
Mining of Massive Dataset, by Anand Rajaraman and Jeff Ullman ( Derived from Stanford CS345) 通俗读本:
更通俗的入门的推荐这本, 很多例子,生动,强调动手和实际问题解决而不是理论:
Programming Collective Intelligence, by Toby Segaran, August 2007.
拓展性读物:
个人也很喜欢下面这本(网上可以下到PDF),一本多个大牛写的关于一些大规模数据分析和挖掘的应用合集,适合进阶的时候当闲书看看。
Beautiful Data by Toby Segaran, Jeff Hammerbacher
还有两本参考书是我放在书架上有什么需要用到,但没有接触过就看看的, 两本都有影印版本:
The Text Mining Handbook by R. Feldman and J. Sanger
Web Data Mining by Bing Liu
基础理论性读物:
最后,想要打好基础,可以回过头来看看这本偏理论的书:
The Elements of Statistical Learning (统计学习基础) by Trevor Hastie etc