数据仓库与数据挖掘应用教程

本书特色

[

本书以SQL Server分析服务为环境介绍数据仓库和数据挖掘应用技术,包括数据仓库和数据挖掘概述、OLAP和多维数据模型、数据仓库设计和SQL Server数据仓库开发实例、关联分析算法、决策树分类算法、贝叶斯分类算法、神经网络算法、回归分析算法、时间序列分析和聚类算法。
本书内容翔实,循序渐进地介绍各个知识点,并提供全面而丰富的教学资源,可作为各类高等院校计算机及相关专业“数据仓库和数据挖掘应用技术”和“SQL Server高级应用”课程的教学用书,也适合计算机应用人员和计算机爱好者参考。

]

内容简介

[

内容全面、知识点详实:在内容讲授上力求详实和全面,细致解析每个知识点和各知识点的联系。
条理清晰、讲解透彻:从介绍数据仓库和数据挖掘的基本概念出发,由简单到复杂,循序渐进介绍数据仓库和数据挖掘系统的开发过程。
精选实例、实用性强:列举了大量的应用示例,读者通过上机模仿可以大大提高使用应用系统开发能力。
配套教学资源丰富:提供了教学PPT、书中所有示例代码、相关数据库文件和ETL源程序。便于读者打开和调试。

]

目录

目录第1章数据仓库和数据挖掘概述1.1数据仓库概述1.1.1数据仓库的定义1.1.2数据仓库与操作型数据库的关系1.1.3数据仓库的应用1.2数据仓库系统及开发工具1.2.1数据仓库系统的组成1.2.2数据仓库系统开发工具1.3商业智能和数据仓库1.3.1什么是商业智能1.3.2商业智能和数据仓库的关系1.4数据挖掘概述1.4.1数据挖掘的定义目录第1章数据仓库和数据挖掘概述1.1数据仓库概述1.1.1数据仓库的定义1.1.2数据仓库与操作型数据库的关系1.1.3数据仓库的应用1.2数据仓库系统及开发工具1.2.1数据仓库系统的组成1.2.2数据仓库系统开发工具1.3商业智能和数据仓库1.3.1什么是商业智能1.3.2商业智能和数据仓库的关系1.4数据挖掘概述1.4.1数据挖掘的定义1.4.2数据挖掘的主要任务1.4.3数据挖掘的对象1.4.4数据挖掘的知识表示1.4.5数据挖掘与数据仓库及OLAP的关系1.4.6数据挖掘的应用1.5数据挖掘过程1.5.1数据挖掘步骤1.5.2数据清理1.5.3数据集成1.5.4数据变换1.5.5数据归约1.5.6离散化和概念分层生成1.5.7数据挖掘的算法练习题第2章OLAP和多维数据模型2.1OLAP概述2.1.1什么是OLAP2.1.2OLAP和OLTP的区别2.1.3数据仓库与OLAP的关系2.2多维数据模型2.2.1多维数据模型的相关概念2.2.2OLAP的基本分析操作2.2.3多维数据模型的实现途径2.3数据仓库的维度建模2.3.1数据仓库建模概述2.3.2星形模型2.3.3雪花模型2.3.4事实星座模型练习题第3章数据仓库设计3.1数据仓库设计概述3.1.1数据仓库设计原则3.1.2建立数据仓库系统的两种模式3.1.3数据仓库设计过程3.2数据仓库规划与需求分析3.2.1数据仓库规划3.2.2数据仓库需求分析3.3数据仓库建模3.3.1数据仓库建模的主要工作3.3.2维表设计3.3.3事实表设计3.4数据仓库物理模型设计3.4.1确定数据的存储结构3.4.2确定索引策略3.4.3确定存储分配3.5数据仓库部署与维护3.5.1数据仓库的部署3.5.2数据仓库的维护练习题第4章SQLServer数据仓库开发实例4.1OnRetDW系统需求分析4.1.1OnRetDW系统的主题4.1.2OnRetDW系统的功能4.2OnRetDW的建模4.2.1维表设计4.2.2事实表设计4.3数据抽取工具设计4.4基于SQL Server 2012设计OnRetDW4.4.1创建数据仓库OnRetDW项目4.4.2创建数据源4.4.3创建数据源视图4.4.4创建维表4.4.5创建多维数据集4.4.6部署SDWS4.4.7浏览已部署的多维数据集4.5MDX简介*4.5.1MDX语言概述4.5.2执行MDX查询4.5.3多维数据查询练习题上机实验题第5章关联分析算法5.1关联分析概述5.1.1什么是关联分析5.1.2事务数据库5.1.3关联规则及其度量5.1.4频繁项集5.1.5挖掘关联规则的基本过程5.2Apriori算法5.2.1Apriori性质5.2.2Apriori算法求频繁项集5.2.3由频繁项集产生强关联规则5.3SQL Server挖掘关联规则5.3.1创建DMK数据库5.3.2建立关联挖掘项目5.3.3部署关联挖掘项目并浏览结果5.4电子商务数据的关联规则挖掘5.4.1创建OnRetDMK数据库5.4.2数据加载功能设计5.4.3建立关联挖掘项目5.4.4部署关联挖掘项目并浏览结果练习题上机实验题第6章决策树分类算法6.1分类过程6.1.1分类概述6.1.2分类过程的学习阶段6.1.3分类过程的分类阶段6.2决策树分类6.2.1决策树6.2.2建立决策树的ID3算法6.3SQL Server决策树分类6.3.1建立数据表6.3.2建立决策树分类挖掘模型6.3.3浏览决策树模型和分类预测6.4电子商务数据的决策树分类6.4.1创建OnRetDMK.DST数据表6.4.2数据加载功能设计6.4.3建立决策树分类模型6.4.4浏览决策树练习题上机实验题第7章贝叶斯分类算法7.1贝叶斯分类概述7.1.1贝叶斯定理7.1.2贝叶斯信念网络7.2朴素贝叶斯分类7.2.1朴素贝叶斯分类原理7.2.2朴素贝叶斯分类算法7.3SQL Server朴素贝叶斯分类7.3.1建立朴素贝叶斯分类挖掘模型7.3.2浏览朴素贝叶斯分类模型和分类预测7.4电子商务数据的贝叶斯分类7.4.1建立朴素贝叶斯分类挖掘模型7.4.2浏览挖掘结果及分析练习题上机实验题第8章神经网络算法8.1人工神经网络概述8.1.1人工神经元8.1.2人工神经网络8.1.3神经网络应用8.2用于分类的前馈神经网络8.2.1前馈神经网络的学习过程8.2.2前馈神经网络用于分类的算法8.3SQL Server神经网络分类8.3.1建立神经网络分类挖掘模型8.3.2浏览神经网络分类模型和分类预测8.4电子商务数据的神经网络分类8.4.1建立神经网络分类挖掘模型8.4.2浏览挖掘结果及分析练习题上机实验题第9章回归分析算法9.1回归分析概述9.2线性回归分析9.2.1一元线性回归分析9.2.2多元线性回归分析9.2.3SQL Server线性回归分析9.3非线性回归分析9.3.1非线性回归分析的处理方法9.3.2可转换成线性回归的非线性回归9.3.3不可变换成线性回归的非线性回归分析*9.4逻辑回归分析9.4.1逻辑回归原理9.4.2逻辑回归模型9.4.3SQL Server逻辑回归分析9.5电子商务数据的逻辑回归分析9.5.1建立逻辑回归挖掘模型9.5.2浏览挖掘结果及分析练习题上机实验题第10章时间序列分析10.1时间序列分析概述10.1.1什么是时间序列和时间序列分析10.1.2时间序列的分类和平稳性判断10.1.3时间序列建模的两种基本假设10.1.4回归分析与时间序列分析10.2确定性时间序列分析10.2.1移动平均模型10.2.2指数平滑模型10.3随机时间序列模型*10.3.1随机时间序列模型概述10.3.2自回归模型AR(p)10.4SQL Server时间序列分析10.4.1建立数据表10.4.2建立时间序列分析模型10.4.3浏览时间序列分析模型10.5电子商务数据的时间序列分析10.5.1创建OnRetDMK.TS数据表10.5.2数据加载功能设计10.5.3建立时间序列分析模型10.5.4浏览时间序列分析模型练习题上机实验题第11章聚类算法11.1聚类概述11.1.1什么是聚类11.1.2相似性度量11.1.3聚类过程11.1.4常见的聚类算法11.1.5聚类分析的应用11.2k�簿�值算法及其应用11.2.1k�簿�值算法11.2.2SQL Server的k�簿�值算法应用11.3EM算法及其应用11.3.1EM算法11.3.2SQL Server中EM算法11.4电子商务数据的聚类分析11.4.1建立聚类挖掘模型11.4.2两种算法结果的比较11.5Microsoft顺序分析和聚类分析算法*11.5.1Microsoft顺序分析和聚类分析算法概述11.5.2Microsoft顺序分析和聚类分析算法的应用练习题上机实验题附录A部分练习题参考答案第1章第2章第3章第4章第5章第6章第7章第8章第9章第10章第11章附录B上机实验题参考答案第4章第5章第6章第7章第8章第9章第10章第11章附录C书中数据库和包含的数据表1. OnRet数据库2. SDW数据库3. OnRetDMK数据库4. DMK数据库参考文献信息

封面

数据仓库与数据挖掘应用教程

书名:数据仓库与数据挖掘应用教程

作者:李春葆

页数:302

定价:¥39.5

出版社:清华大学出版社

出版日期:2016-10-01

ISBN:9787302430773

PDF电子书大小:139MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注