LIAOCHENG UNIVERSITY
计算机学院实验报告
【一、基本信息】 【20 15 ~20 16 学年第 1 学期】
【实验课程】 商务智能 【设课形式】 □ 非 【课程学分】 4 【实验项目】 实验三 数据挖掘 【项目类型】 基础□ 综合□ 设计 研究创新□ 其它[ ] 【项目学时】 【学生姓名】 王昭 【学 号】 2013204636 【系别专业】 信息管理与信息系统 【实验班组】 2013级 7 班 组 台 【同组学生】 【实验室名】 【实验日期】 【报告日期】 【二、实验教师对报告的最终评价及处理意见】 实验成绩: (涂改无效) 指导教师签名: 年 月 日 注:要将实验项目、实验课程的成绩评定及课程考核办法明确告知学生,并报实验管理中心备案 1
【三、实验预习】 实验目的和要求: 理解数据挖掘过程,并设计数据挖掘应用案例。 实验内容和原理或涉及的知识点(综合性实验): 利用SQL Server 2008 BI开发环境创建一个具有决策树算法的挖掘结构。 (还可以建立“Microsoft聚类分析”挖掘模型和“Microsoft Naive Bayes”挖掘模型,选作) 实验条件(实验设备、软件、材料等): SQL Server 数据库引擎 Analysis Services Business Intelligence Development Studio AdventureWorks2008R2DW2008 示例数据库 实验设计方案(实验方法、步骤、操作过程、设计型实验、实验数据记录表格): 1、启动SQL Server 2008 BI的开发环境; 2、创建一个Analysis Services项目,定义一个单个数据源,并向数据源视图添加一个表子集; 3、使用“数据挖掘向导”来创建Targeted Mailing挖掘结构,在此挖掘结构中,创建一个具有决策树算法的挖掘模型; 4、理解决策树模型。 2
实验预习成绩(涂改无效) 合格□ 不合格□ 3
【四、实验过程、数据和实验结果记录】 ①实验方法、步骤、操作过程的记录描述或程序代码。②实验过程中输入/输出数据、程序运行结果的记录。(可加附页) (1) 准备 Analysis Services 数据库 1.打开程序->Microsoft SQL Server 2008->SQL Server Business Intelligence Development Studio,启动SQL Server 2008 BI的开发环境。 2.在“文件”菜单上,指向“新建”,然后选择“项目”。选中“项目类型”窗格中的“商业智能项目”。选中“模板”窗格中的“Analysis Services 项目”。在“名称”框中,将新项目命名为 AS Data Mining 2008。单击“确定”。 3. 在Business Intelligence Development Studio中,选择“项目”菜单中的“属性”。在“属性页”窗格左侧的“配置属性”下,单击“部署”。在“属性页”窗格右侧的“目标”下,确保“服务器”名称为localhost。如果使用的是其他实例,请键入该实例的名称。单击“确定”。 4. 在“解决方案资源管理器”中,右键单击“数据源”文件夹,然后选择“新建数据源”。 4
在“欢迎使用数据源向导”页面中,单击“下一步”按钮 在“选择如何定义连接”页上,单击“新建”向 Adventure Works DW 2008 R2 数据库中添加连接。 (注意此步骤前必须已经启动了sql server和sql server Analysis services,并确认两者的登录身份为localSystem) 在“服务器名称”框中,键入或选择安装了AdventureWorksDW2008R2的服务器的名称。例如,如果是在本地服务器上承载该数据库,请键入localhost。如果使用的是其他实例,请键入该实例的名称。在“登录到服务器”组中,选择“使用 Windows 身份验证” 连接到一个数据库时,选择AdventureWorksDW2008R2数据库,然后单击“确定”。 单击“下一步” 5.在“模拟信息”页中,单击“使用服务帐户”,再单击“下一步”。在“完成向导”页中,请注意数据源名称默认为Adventure Works DW2008R2。单击“完成”。此时,解决方案资源管理器的“数据源”文件夹中将出现刚创建的新数据源Adventure Works DW2008R2。 6.在解决方案资源管理器中,右键单击“数据源视图”并选择“新建数据源视图”。 在“欢迎使用数据源视图向导”页中,单击“下一步”。 5
在“选择数据源”页的“关系数据源”下方,选择在上一个任务中创建的 Adventure Works DW2008R2 数据源。单击“下一步”。 7.在“选择表和视图”页上,选择下列对象,然后单击右箭头键,将它们包括在新数据源视图中:ProspectiveBuyer (dbo) - 预期自行车购买者的表 vTargetMail (dbo) - 有关以前的自行车购买者的历史数据的视图 6
单击“下一步”。在“完成向导”页上,系统默认将数据源视图命名为Adventure Works DW2008R2。将该名称更改为Targeted Mailing,然后单击“完成”。新数据源视图随即在“Targeted Mailing.dsv [设计]”选项卡中打开 (2) 生成 Targeted Mailing 结构 1.在解决方案资源管理器中,右键单击“挖掘结构”并选择“新建挖掘结构”启动数据挖掘向导。 在“欢迎使用数据挖掘向导”页上,单击“下一步”。 在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”, 再单击“下一步”。在“创建数据挖掘结构”页的“你们要使用何种数据挖掘技术?”下,选择“Microsoft 决策树”。
7
2.单击“下一步”。在“选择数据源视图”页上的“可用数据源视图”窗格中,选择 Targeted Mailing。可单击“浏览”查看数据源视图中的各表,然后单击“关闭”返回该向导。单击“下一步”。 制定表类型,指定定型数据。
8
①实验方法、步骤、操作过程的记录描述或程序代码。②实验过程中输入/输出数据、程序运行结果的记录。(可加附页) 在“指定列的内容和数据类型”页上,单击“检测”运行用来确定每列的默认数据类型和内容类型的算法。 在“创建测试集”页上,将“测试数据百分比”保留其默认值:30。对于“测试数据集中的最大事例数”,请键入 1000。单击“下一步”。 在“完成向导”页上的“挖掘结构名称”中,键入Targeted Mailing。在“挖掘模型名称”中,键入TM_Decision_Tree。选中“允许钻取”复选框。单击“完成”。 9
(3) 处理挖掘模型 1.在 Business Intelligence Development Studio 的数据挖掘设计器中,单击“挖掘结构”选项卡或“挖掘模型”选项卡。Targeted Mailing MiningStructure 显示在“属性”窗格中。确保按 F4 可以打开“属性”窗格。确保 CacheMode 已设置为 KeepTrainingCases。 HoldoutSeed 设置为12。 .在“挖掘模型”菜单上选择“处理挖掘结构和所有模型”。 如果更改了结构,系统将提示你们在处理模型之前生成和部署项目。单击“是”。
10
在“处理挖掘结构 - Targeted Mailing”对话框中单击“运行”。 11
实验结果分析 三个级别的决策树的预览图
12
四个级别的决策树的预览图: 把购买的与非购买的设置不同的背景颜色 13
在Number Childern At Home 不等于1上看出(0表示非购买)数量是1313(1表示购买)数量是519 在Age>=38and<45节点上看出购买的是2559,非购买的是1454 14
(2)钻取到事例数据 钻取年龄与地区,年龄与收入可看出,两个表哥是一样的 Bike Buyer与所有属性的联系图: 15
年龄与Bike Buyer的关系最强烈: 地区与Bike Buyer的联系低于年龄,但也有较强的联系: 16
记录成绩(涂改无效) 合格□ 不合格□ 【五、实验结果分析】 ①根据理论知识对所得到的实验数据或结果进行解释、分析。②对实验结果所作的一般性的判断、归纳、概括,实验的心得体会、建议等。 1.通过这次的实验,又进一步的了解数据库Analysis Services的功能,掌握了它的一些间的应用能力,和一些基本的操作。 2.通过应用数据库Analysis Services的一些功能,能够分析一些数据之间的联系,有利于做出判断与决策。 17