数据仓库与数据挖掘课程设计指导书好好学习天天向上

时间:2022-04-08 11:59:29 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
助您高榜提名

一、 设计内容:

1. 选题范围

1 A.基础选题:选择以现实中的各类数据为背景(如商业客户数据,商品数据等),运用SPSS Modeler等数据挖掘软件进行数据分析和模式挖掘。

2 扩展选题:选择以算法为主要研究对象,对数据挖掘相关算法(如关联规则、分类算法、聚 算法等)进行程序设计并运用测试数据进行对比分析,同时对结果进行分析总结。

请在AB范国内自行确定选题。

2. 要求

1 提出所要解决的问题,问题要符合实际:

2 根据主题,分别形成多个子问题,并且子问题必须用绕整体主题展开,不能偏离主题; 3 掌握数据挖掘工具的基本操作功能,并将理论课程的算法应用于数据分析。

3. 主要内容

选题A可以运用并种数据挖掘工具软件(如Microsoft Business Intelligence Development Studio BIDS))SPSS Modeler. Weka等)进行具有背景资料的数拯主题分析为主,数据挖掘报 告主要内容应具有:确左挖掘主题和方法、数据选择和预处理、挖掘方法实现、挖掘数据、模式 可视化表达与解释流程几部分。

选题B以某一方而(如关联规则、聚类、分类)算法对比进行分析为主,则注重对比算法的 择,测试数据的选择和处理以及相应的程序实现软件行。在设汁中体现聚类分析、分类发现和 关联规则等数据挖掘算法的使用环境、算法特点,并能进行算法复杂性的分析。 二、 设计步骤、要点与关键分析:

1. 设计步骤:

1 查找数据及背景资料,收集数据; 2 熟悉相关算法及软件:

3 根据选题确定研究主题或所要对比的算法;

4 利用SPSS Modeler. Mat lab等软件进行数据挖掘或算法测试; 5 进行结果分析,撰写出符合要求的综合实践报告。

2. 设计要点

选题A的主要设计要点:

1 确定挖掘主题和方法:根据挖掘的主题和目标,确定合适的挖掘方法。

2 数据选择和预处理:根据所收集数据,填充缺失值,平滑噪声数拯,消除异常值,解决数据 一致等问题。


3 挖掘方法实现:规划挖掘过程,界而设讣,挖掘方法实现。 4 挖掘数据:对预处理后的数据进行算法选择及挖掘。

5 模式的可视化表达与解释:根拯应用领域的信息和知识需求,以直观有效的形式,如图表等 显示数据挖掘出的模式,用特左领域的知识加以解释,使得用户能够理解和接受。 选题B的主要设计要点:

1 需求和规格说明描述问题,简述题目要对比的算法,规定开发软件。 2 设计

1 设计思想:程序结构(如类图),重要的数据结构。主要算法思想(文字描述为主,可以画框 为辅)

2 设计表示:各模块数据描述和算法描述,可以用表格形式表达。 3 详细设计表示:主要算法的框架及实现此算法的成员函数接口。 3 用户手册:即使用说明(包括数据输入时的格式要求)。 4 调试:调试过程中遇到的主要问题是如何解决的。

5 运行结果:上而测试数据输入后程序运行的结果及算法对比结果。程序运行的时空效率分析: 测试数据集:运行实例:改进设想:经验和体会。

6 附录

1 程序淸单:打印文本和电子版文件,电子版文件是必须的。源程序要加注释。 2 测试数据:即列岀测试数据集

注意事项:以上要求为一般的要求,针对具体问题和具体的开发过程,某些方面可以做适当的增减。 三、设计进度安排:

1天:学习课程设计资料,依据个人兴趣决左设计题目,查阅相关专业词典、手册或其它工具 书,收集数据,确定预期研究主题。

2-4天:撰写研究流程及方案,选择相关算法,操作数据软件收集数据,进行分析数据前的准 工作。

5天:处理数据,撰写分析过程,针对结果要求调整策略,并对结果进行对比分析。 6-14天:按规范格式撰写并提交报告。

20191212日提交课程设计文档(打印版)和设计过程文件(包括数拯文件、算法、模型 等与课程设计有关的文件),由学委收齐统一上交。 三、 设分组

要求每班同学2-3人一组完成课程设讣,并以书面形式写岀具体分工。 四、 计参考资料

[11麼开际.《数据仓库与数据挖掘》,北京:北京大学出版社,200811 [2] Jiawei han.《数据挖掘:概念与技术》(第二版)机械工业岀版社20073

[3] Gordon S. Linoff, Michael J. A. Berry.《数据挖掘技术:应用于市场营销、销售与客户关


管理(第3版)》,北京:军事医学科学出版社,20133

[4] 王国平,郭伟宸等.UBM SPSS Modeler数据与文本挖掘实战》,北京:淸华大学出版社,2014 11

[5] 张大斌,《数据挖掘与商务智能实验教程》,华中师范大学出版社,20151 [6] 薛薇,《基于SPSS Modeler的数据挖掘》,中国人民大学出版社,201410 [8] 李春葆等,《数据仓库与数据挖掘实践》,电子工业出版社2014 [9] 张兴会,《数据仓库与数据挖掘技术》,淸华大学岀版社,2014. [10] 张兴会,《数据仓库与数据挖掘工程实例》,淸华大学出版社,2014.

[11] 袁梅宇,《数据挖掘与机器学习WEKA应用技术与实践》,淸华大学岀版社,2016.8 [12] 浙江大学,《概率论与数理统计》,淸华大学出版社2008 [13] 李航,《统计学习方法》,淸华大学出版社,2019.


本文来源:https://www.wddqw.com/doc/255ef32da78da0116c175f0e7cd184254a351b39.html