由于弄来本课件时不知道设置了密码,故大家暂时不要下载上海财经大学研究生教学与进度表 课程名称: 数据挖掘与知识发现 授课教师:刘鹏授课对象: 硕士生 年级专业:信息管理与工程学院研究生课程性质:专业选修课 考核方式: 闭卷70%开卷%讨论20%论文%案例%考勤10%其他% 教材及主要参考书目:Pang-Ning Tan,Michael Steinbach,Vipin Kumar,Introduction to Data Mining(英文版),北京:人民邮电出版社,2006Kantardzic, M., Data Mining: Concepts, Models, Methods, and Algorithms, Wiley-IEEE Press, November 2003Margaret H. Dunham, Data Mining: Introductory and Advanced Topics,Prentice Hall; 1st edition (August 22, 2002)Ian H.Witten, Eide Frank, Data Mining: Practical Learning Tools and Techniques with Java Implementations (Second Edition) (英文影印版)(第2版),机械工业出版社,2005Hand, D., Mannila, H., and Smyth, P., Principles of Data Mining, MIT Press; (August 1, 2001)Jiawei Han, Micheline Kamber, Data Mining: Concepts & Techniques, Morgan Kaufmann (August 2000)课程内容及进度安排:周 次 日 期 授 课 内 容 授 课 方 式1 2月24日 数据挖掘导论,讨论数据挖掘的基本概念,发展历程,未来发展方向 阅读和讲解论文23月3日 数据:数据的类型、质量和预处理;相似性度量问题的讨论 阅读教材和论文讨论33月10日 数据探索:统计处理方法、可视化技术、OLAP与多维数据分析 阅读教材和论文讨论43月17日 分类基础:分类概念;决策属归纳;过度拟合问题;分类器评价与分类模型比较 阅读教材和论文讨论53月24日 分类技术:基于规则的分类器;最邻近技术;贝叶斯分类;人工神经网络等技术讨论 阅读教材和论文讨论63月31日 关联分析基础:频繁项基;规则产生;关联模式评估 阅读教材和论文讨论74月7日 关联规则技术:分类与连续性属性处理;概念层处理;序列模式和非平凡模式 阅读教材和论文讨论84月14日 聚类基础:k-平均;凝聚层次聚类;聚类评估 阅读教材和论文讨论94月21日 聚类基础:数据特征与聚类算法;基于原形、密度、图的聚类;聚类算法的可扩展性 阅读教材和论文讨论104月28日 异常点分析:统计方法、基于邻近、密度、聚类的方法 阅读教材和论文讨论115月5日 案例分析与实践I:电信数据 阅读教材和论文讨论125月12日 案例分析与实践II:人力资源数据挖掘解决方案 阅读教材和论文讨论
附件列表