一、主讲老师
二、课程开设单位
复旦大学信息学院
三、课程性质
研究生专业课,适合于计算机软件和计算机应用专业。
四、预修课程
数据结构与算法 /
数据库原理 /人工智能基础 或者
机器学习。
五、教学目的和要求
通过本课程的教学,使学生了解数据挖掘的基本概念、方法、技术、算法以及应用,为学员开展相关的应用开发以及进一步的学习与研究打下基础。
六、教学方式
老师讲授为主;学生在老师指导下,阅读参考文献与书籍,并完成课程项目(project)或者课程论文。
七、考核方式
-
平时课程表现(M)
-
期末考试(F)
-
成绩计算:Score=M×20%+F×80%
八、指定课程教材
-
Jiawei
Han, Micheline Kamber,Data Mining:
Concepts and Techniques, Morgan Kaufmann Publisher, 2000(中国高教出版社影印出版)
-
中译本:《数据挖掘:概念与技术》,范明、孟小峰等译,机械工业出版社出版.
九、参考教材
-
Pang-Ning
Tan, Michael Steinbach, and Vipin Kumar, Introduction to Data Mining,
Pearson Education, 2005 (人民邮电出版社影印出版)
-
Margaret
H. Dunham, Data Mining: Introductory and Advanced Topics, Pearson
Education, 2003(清华大学出版社影印出版)
-
Ian
H. Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools
and Techniques (2nd edition), Elsevier Inc., 2005(机械工业出版社出版影印出版)
-
David
Hand, Heikki Mannila, and Padhraic Smyth, Principles of Data Mining,
MIT, 2001.
-
数据挖掘主要相关会议论文集
-
SIGKDD,
PODS/SIGMOD, VLDB, IEEE-ICDE, IEEE-ICDM, SIAM-DM, PAKDD, PKDD等
-
数据挖掘主要相关国际期刊
-
ACM
Transactions on Knowledge Discovery from Data
-
IEEE
Transactions on Data and Knowledge Engineering
-
International
Journal of Data Mining and Knowledge Discovery
-
数据挖掘网络资源
-
SIGKDD
Explorations://www.acm.org/sigs/sigkdd/explorations/issue.php?issue=current
-
Weka
project: www.cs.waikato.ac.nz/~ml/index.html
-
IBM
Almaden Reseach Center Data Mining Group: //www.almaden.ibm.com/software/disciplines/iis/
-
一个数据挖掘中文网站:www.dmresearch.net/index.jsp
十、欺骗惩罚
一旦在课程项目/论文和考试中发现如下欺骗行为,将取消该门课程成绩:
抄袭论文、抄袭程序代码和考试作弊。
十一、课程安排
上课时间:每周日12:30-15:00
上课地点: 复旦邯郸校区3305#
课程周 |
时间 |
讲授要点 |
阅读书目 |
教学目标 |
课件 |
第1周 |
3月11日 |
数据挖掘概念、过程、功能、系统分类和主要研究问题 |
第1章 |
掌握数据挖掘概念、过程、功能、系统分类和主要研究问题 |
Lecture-0
Lecture-1 |
第2周 |
3月18日 |
数据预处理的概念与基本方法 |
第3章 |
掌握数据预处理的概念与基本方法 |
Lecture-2 |
第3周 |
3月25日 |
数据仓储与OLAP的基本概念与技术 |
第2章 |
掌握数据仓储与OLAP的基本概念与技术 |
Lecture-3 |
第4周 |
4月1日 |
介绍一种数据挖掘元语和语言,给出数据挖掘系统的基本框架 |
第4章 |
简单了解数据挖掘元语和语言以及数据挖掘系统的基本框架 |
Lecture-4a
Lecture-4b |
|
第5周
|
4月8日 |
介绍关联规则挖掘的基本概念与基本算法 |
第6.1-6.3节 |
掌握关联规则挖掘的基本概念与基本算法 |
Lecture-5a
Lecture-5b |
第6
周 |
4月15日 |
介绍关联规则挖掘的高级算法 |
第6.4-6.6节 |
掌握关联规则挖掘的几种高级算法 |
Lecture-5b
References |
第7周 |
4月22日 |
分类与预测的基本概念,决策树分类与Bayesian分类 |
第7.1-7.4节 |
掌握决策树分类与Bayesian分类 |
Lecture-6a |
第8周 |
4月29日 |
介绍其它几种分类与预测方法 |
第7.6-7.9节 |
了解其它几种分类与预测方法 |
Lecture-6b |
第9周 |
5月6日 |
介绍聚类分析的基本概念与基本算法 |
第8.1-8.5节 |
掌握聚类分析的基本概念与基本算法 |
Lecture-7a |
第10周 |
5月13日 |
介绍聚类分析的高级算法 |
第8.6-8.8节 |
了解聚类分析的几种高级算法 |
Lecture-7b |
第11周 |
5月20日 |
介绍奇异模式检测的基本概念与主要算法 |
第8.9节 |
掌握奇异模式检测的基本概念与主要算法 |
Lecture-8 |
第12周 |
5月27日 |
介绍空间数据挖掘的问题与主要算法 |
第9.2节 |
掌握空间数据挖掘的问题与主要算法 |
Lecture-9 |
第13周 |
6月3日 |
介绍时序模式挖掘的基本概念与主要算法
|
第9.4节 |
掌握时序模式挖掘的基本概念与主要算法 |
Lecture-10
Lecture-11 |
第14周 |
6月10日 |
介绍文本与Web挖掘的基本概念、主要问题与核心算法
|
第9.5-9.6节 |
掌握文本与Web挖掘的基本概念、主要问题与核心算法 |
Lecture-12 |
第15周 |
6月17日 |
介绍几个数据挖掘在商业智能中的应用案例 |
补充材料 |
了解如何把数据挖掘应用领域和发展趋势 |
Lecture-13 |
第16周 |
6月24日 |
介绍几个数据挖掘在商业智能中的应用案例
|
补充材料 |
了解把数据挖掘应用于商业智能中的实际案例 |
Lecture-14 |
第17周 |
7月1日 |
没有课,准备考试 |
第17周 |
7月8日 |
期末考试
关于考试等的说明
|
十二、鸣谢
本课程教案主要内容是根据1)Jiawei
Han教授针对"Data Mining:
Concepts and
Techniques"一书制作的数据挖掘教案,和2)Pang-Ning
Tan教授针对“Introduction to Data
Mining”所制作的数据挖掘教案进行补充、删减和整理而成,特此向Jiawei
Han教授和Pang-Ning Tan教授表示感谢!
Back to Shuigeng's
Homepage
|