《数据挖掘技术与应用》(Mar 2007 - Jun 2007)

(http://admis.fudan.edu.cn/member/sgzhou/courses/data-mining-2007s/2007dm.htm)

一、主讲老师

  • 周水庚教授

  • 办公室:袁成英计算机楼 405

  • 电话:55664298

  • Email: sgzhou@fudan.edu.cn

  • 主页:http://admis.fudan.edu.cn/member/sgzhou/index.htm

 二、课程开设单位

  复旦大学信息学院

 三、课程性质

  研究生专业课,适合于计算机软件和计算机应用专业。

 四、预修课程

  数据结构与算法 / 数据库原理 /人工智能基础 或者 机器学习。

 五、教学目的和要求

  通过本课程的教学,使学生了解数据挖掘的基本概念、方法、技术、算法以及应用,为学员开展相关的应用开发以及进一步的学习与研究打下基础。

六、教学方式

  老师讲授为主;学生在老师指导下,阅读参考文献与书籍,并完成课程项目(project)或者课程论文

七、考核方式

  • 平时课程表现(M

  • 期末考试(F

  • 成绩计算:Score=M×20%+F×80%

八、指定课程教材

  • Jiawei Han, Micheline KamberData Mining: Concepts and Techniques, Morgan Kaufmann Publisher, 2000(中国高教出版社影印出版)

  • 中译本:《数据挖掘:概念与技术》,范明、孟小峰等译,机械工业出版社出版.

九、参考教材

  • Pang-Ning Tan, Michael Steinbach, and Vipin Kumar, Introduction to Data Mining, Pearson Education, 2005 (人民邮电出版社影印出版)

  • Margaret H. Dunham, Data Mining: Introductory and Advanced Topics, Pearson Education, 2003(清华大学出版社影印出版)

  • Ian H. Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques (2nd edition), Elsevier Inc., 2005(机械工业出版社出版影印出版)

  • David Hand, Heikki Mannila, and Padhraic Smyth, Principles of Data Mining, MIT, 2001. 

  • 数据挖掘主要相关会议论文集

    • SIGKDD, PODS/SIGMOD, VLDB, IEEE-ICDE, IEEE-ICDM, SIAM-DM, PAKDD, PKDD

  • 数据挖掘主要相关国际期刊

    • ACM Transactions on Knowledge Discovery from Data

    • IEEE Transactions on Data and Knowledge Engineering

    • International Journal of Data Mining and Knowledge Discovery

  • 数据挖掘网络资源

    • SIGKDD Explorations://www.acm.org/sigs/sigkdd/explorations/issue.php?issue=current 

    • Weka project: www.cs.waikato.ac.nz/~ml/index.html

    • IBM Almaden Reseach Center Data Mining Group: //www.almaden.ibm.com/software/disciplines/iis/

    • 一个数据挖掘中文网站:www.dmresearch.net/index.jsp

十、欺骗惩罚

  一旦在课程项目/论文和考试中发现如下欺骗行为,将取消该门课程成绩: 抄袭论文、抄袭程序代码和考试作弊。

十一、课程安排 

              上课时间:每周日12:30-15:00           上课地点: 复旦邯郸校区3305#  

课程周

时间

讲授要点

阅读书目

教学目标

课件

1

311

数据挖掘概念、过程、功能、系统分类和主要研究问题

1

掌握数据挖掘概念、过程、功能、系统分类和主要研究问题

Lecture-0

Lecture-1

2

318

数据预处理的概念与基本方法

3

掌握数据预处理的概念与基本方法

Lecture-2

3

3月25

数据仓储与OLAP的基本概念与技术

2

掌握数据仓储与OLAP的基本概念与技术

Lecture-3

4

41

介绍一种数据挖掘元语和语言,给出数据挖掘系统的基本框架

4

简单了解数据挖掘元语和语言以及数据挖掘系统的基本框架

Lecture-4a

Lecture-4b

第5周

 48

介绍关联规则挖掘的基本概念与基本算法

6.1-6.3

掌握关联规则挖掘的基本概念与基本算法

Lecture-5a
Lecture-5b

6

415

介绍关联规则挖掘的高级算法

6.4-6.6

掌握关联规则挖掘的几种高级算法

Lecture-5b

References

7

422

分类与预测的基本概念,决策树分类与Bayesian分类

7.1-7.4

掌握决策树分类与Bayesian分类

Lecture-6a

8

429

介绍其它几种分类与预测方法

7.6-7.9

了解其它几种分类与预测方法

Lecture-6b

第9周

5月6日

介绍聚类分析的基本概念与基本算法

8.1-8.5

掌握聚类分析的基本概念与基本算法

Lecture-7a

第10周

5月13日

介绍聚类分析的高级算法

8.6-8.8

了解聚类分析的几种高级算法

Lecture-7b

11

5月20日

介绍奇异模式检测的基本概念与主要算法

8.9

掌握奇异模式检测的基本概念与主要算法

Lecture-8

第12周

5月27日

介绍空间数据挖掘的问题与主要算法

9.2

掌握空间数据挖掘的问题与主要算法

Lecture-9

第13周

6月3日

介绍时序模式挖掘的基本概念与主要算法

9.4

掌握时序模式挖掘的基本概念与主要算法

Lecture-10

Lecture-11

14

6月10日

介绍文本与Web挖掘的基本概念、主要问题与核心算法 

9.5-9.6

掌握文本与Web挖掘的基本概念、主要问题与核心算法

Lecture-12

第15周

6月17日

介绍几个数据挖掘在商业智能中的应用案例

补充材料

了解如何把数据挖掘应用领域和发展趋势

Lecture-13

第16周

6月24日

介绍几个数据挖掘在商业智能中的应用案例

补充材料

了解把数据挖掘应用于商业智能中的实际案例

Lecture-14

第17周

7月1日

没有课,准备考试

第17周

7月8日

期末考试 

关于考试等的说明

十二、鸣谢

  本课程教案主要内容是根据1)Jiawei Han教授针对"Data Mining: Concepts and Techniques"一书制作的数据挖掘教案,和2)Pang-Ning Tan教授针对“Introduction to Data Mining”所制作的数据挖掘教案进行补充、删减和整理而成,特此向Jiawei Han教授和Pang-Ning Tan教授表示感谢!

Back to Shuigeng's Homepage