数据仓库与数据挖掘实践

本书特色

[

本书系统地介绍了数据仓库和数据挖掘技术,全本由两部分组成,第1章到第3章介绍数据仓库的基本概念和相关技术,第4章到第11章介绍数据挖掘的基本概念和各种算法,包括数据仓库构建、olap技术、分类方法、聚类方法、关联分析、序列模式挖掘方法、回归和时序分析、粗糙集理论、文本挖掘、web挖掘和空间数据挖掘方法等。
  本书既注重原理,又注重实践,配有大量图表、示例和练习题,内容丰富,概念讲解清楚,表达严谨,逻辑性强,语言精练,可读性好。
  本书既便于教师课堂讲授,又便于自学者阅读。适合作为高等院校高年级学生和研究生“数据仓库和数据挖掘”或“数据挖掘算法”课程的教材。

]

目录

第 1 章数据仓库概述 1.1 数据仓库及其历史 1.1.1 数据库技术的发展1.1.2 什么是数据仓库1.2 数据仓库系统及其开发工具1.2.1 数据仓库系统的组成1.2.2 etl 1.2.3 数据仓库和数据集市的关系1.2.4 元数据及其管理1.3 数据仓库系统开发工具1.4 数据仓库与操作型数据库的关系1.4.1 从数据库到数据仓库1.4.2 数据仓库为什么是分离的1.4.3 数据仓库与操作型数据库的对比1.4.4 ods 1.5 商务智能与数据仓库的关系练习题 1 思考题 1 第 2 章数据仓库设计2.1 数据仓库设计概述2.1.1 数据仓库设计原则2.1.2 数据仓库构建模式2.1.3 数据仓库设计步骤2.2 数据仓库的规划和需求分析2.2.1 数据仓库的规划2.2.2 数据仓库的需求分析2.3 数据仓库的建模2.3.1 多维数据模型及相关概念vi2.3.2 多维数据模型的实现2.3.3 数据仓库建模的主要工作2.3.4 几种常见的基于关系数据库的多维数据模型2.4 数据仓库的物理模型设计2.4.1 确定数据的存储结构2.4.2 确定索引策略2.4.3 确定存储分配2.5 数据仓库的部署和维护2.5.1 数据仓库的部署2.5.2 数据仓库的维护2.6 一个简单的数据仓库sdws 设计示例2.6.1 sdws 的需求分析2.6.2 sdws 的建模2.6.3 基于sql server 2008 设计sdws练习题 2思考题 2 第 3 章 olap 技术3.1 olap 概述3.1.1 什么是olap 3.1.2 olap 技术的特性3.1.3 olap 和oltp 的区别3.1.4 数据仓库与olap 的关系3.1.5 olap 分类3.2 olap 的多维数据模型3.2.1 多维数据模型的定义3.2.2 olap 的基本分析操作3.2.3 一个简单的多维数据模型3.3 olap 实现3.3.1 数据立方体的有效计算3.3.2 索引olap 数据3.3.3 olap 查询的有效处理练习题 3思考题 3 第 4 章数据挖掘概述4.1 什么是数据挖掘4.1.1 数据挖掘的定义4.1.2 数据挖掘的知识表示4.1.3 数据挖掘的主要任务4.1.4 数据挖掘的发展vii4.1.5 数据挖掘的对象4.1.6 数据挖掘的分类4.1.7 数据挖掘与数据仓库及olap 的关系4.1.8 数据挖掘的应用4.2 数据挖掘系统4.2.1 数据挖掘系统的结构4.2.2 数据挖掘系统的设计4.2.3 常用的数据挖掘系统及其发展4.3 数据挖掘过程4.3.1 数据挖掘步骤4.3.2 数据清理4.3.3 数据集成4.3.4 数据变换4.3.5 数据归约4.3.6 离散化和概念分层生成4.3.7 数据挖掘的算法4.4 数据挖掘的未来展望练习题 4 思考题 4 第 5 章关联分析5.1 关联分析的概念5.1.1 事务数据库5.1.2 关联规则及其度量5.1.3 频繁项集5.1.4 挖掘关联规则的基本过程5.2 apriori 算法5.2.1 apriori 性质5.2.2 apriori 算法5.2.3 由频繁项集产生关联规则5.2.4 提高apriori 算法的有效性5.2.5 非二元属性的关联规则挖掘5.3 频繁项集的紧凑表示5.3.1 *大频繁项集5.3.2 频繁闭项集5.4 fp-growth 算法5.4.1 fp-growth 算法框架5.4.2 fp 树构造5.4.3 由fp 树产生频繁项集5.5 多层关联规则的挖掘viii5.5.1 多层关联规则的挖掘概述5.5.2 多层关联规则的挖掘算法5.5.3 多维关联规则5.6 其他类型的关联规则5.6.1 基于约束的关联规则 5.6.2 负关联规则5.7 sql server 挖掘关联规则的示例5.7.1 建立dm 数据库5.7.2 建立关联挖掘项目5.7.3 部署关联挖掘项目并浏览结果练习题 5思考题 5 第 6 章序列模式挖掘6.1 序列模式挖掘概述6.1.1 序列数据库6.1.2 序列模式挖掘算法6.2 apriori 类算法6.2.1 aprioriall 算法6.2.2 apriorisome 算法 6.2.3 dynamicsome 算法6.2.4 gsp 算法 6.2.5 spade 算法6.3 模式增长框架的序列挖掘算法6.3.1 freespan 算法6.3.2 prefixspan 算法练习题 6思考题 6 第 7 章分类方法7.1 分类过程7.1.1 学习阶段 7.1.2 分类阶段 7.2 k-*邻近分类算法7.3 决策树分类算法7.3.1 决策树7.3.2 建立决策树的id3 算法7.3.3 建立决策树的c4.5 算法7.4 贝叶斯分类算法7.4.1 贝叶斯分类概述7.4.2 朴素贝叶斯分类ix7.4.3 树增强朴素贝叶斯分类7.5 神经网络算法7.5.1 生物神经元和人工神经元7.5.2 人工神经网络7.5.3 前馈神经网络用于分类7.5.4 sql server 中神经网络分类示例7.6 支持向量机7.6.1 线性可分时的二元分类问题7.6.2 线性不可分时的二元分类问题练习题 7 思考题 7 第 8 章回归分析和时序挖掘8.1 线性和非线性回归分析8.1.1 一元线性回归分析8.1.2 多元线性回归分析8.1.3 非线性回归分析8.2 逻辑回归分析8.2.1 逻辑回归原理8.2.2 逻辑回归模型8.2.3 sql server 中逻辑回归分析示例8.3 时序分析模型8.3.1 时序分析概述8.3.2 时序预测的常用方法8.3.3 回归分析与时序分析的关系8.3.4 确定性时序模型8.3.5 随机时序模型8.3.6 sql server 建立随机时序模型示例8.4 时序的相似性搜索8.4.1 相似性搜索的概念8.4.2 完全匹配8.4.3 基于离散傅里叶变换的子序列匹配8.4.4 基于规范变换的子序列匹配练习题 8 思考题 8 第 9 章粗糙集理论9.1 粗糙集理论概述9.1.1 粗糙集理论的产生9.1.2 粗糙集理论的特点9.1.3 粗糙集理论在数据挖掘中的应用x9.2 粗糙集理论中的基本概念9.2.1 集合的基本概念9.2.2 信息系统和粗糙集9.2.3 分类的近似度量9.3 信息系统的属性约简9.3.1 约简和核 9.3.2 分辨矩阵求核9.4 决策表及其属性约简9.4.1 决策表及相关概念9.4.2 决策表的属性约简算法9.5 决策表的值约简及其算法9.5.1 决策规则及其简化9.5.2 决策规则的极小化9.6 粗糙集在数据挖掘中的应用示例练习题 9思考题 9 第 10 章聚类方法10.1 聚类概述10.1.1 什么是聚类10.1.2 相似性测度10.1.3 聚类过程10.1.4 聚类算法的评价 10.1.5 聚类方法的分类 10.1.6 聚类分析在数据挖掘中的应用10.1.7 聚类算法的要求 10.2 基于划分的聚类算法10.2.1 k-均值算法10.2.2 k-中心点算法10.3 基于层次的聚类算法10.3.1 层次聚类算法概述10.3.2 diana 算法和agnes 算法10.3.3 birch 算法10.3.4 cure 算法10.3.5 rock 算法10.3.6 chameleon 算法10.4 基于密度的聚类算法10.4.1 dbscan 算法10.4.2 optics 算法10.5 基于网格的聚类算法xi10.5.1 sting 算法10.5.2 wavecluster 算法10.5.3 clique 算法10.6 基于模型的聚类算法10.6.1 em 算法10.6.2 cobweb 算法10.7 离群点分析10.7.1 离群点概述10.7.2 常见的离群点检测方法练习题 10 思考题 10 第 11 章其他挖掘方法11.1 文本挖掘11.1.1 文本挖掘概述11.1.2 数据预处理技术11.1.3 文本结构分析11.1.4 文本分类11.1.5 文本聚类11.1.6 文本摘要11.1.7 文本关联分析11.2 web 挖掘11.2.1 web 挖掘概述11.2.2 web 结构挖掘11.2.3 web 内容挖掘11.2.4 web 使用挖掘11.2.5 web 挖掘的发展方向11.3 空间数据挖掘11.3.1 空间数据概述11.3.2 空间数据立方体和空间olap11.3.3 空间数据挖掘方法练习题 11 思考题 11 附录a 常用的优化方法参考文献

封面

数据仓库与数据挖掘实践

书名:数据仓库与数据挖掘实践

作者:李春葆

页数:355

定价:¥48.0

出版社:电子工业出版社

出版日期:2014-11-01

ISBN:9787121244926

PDF电子书大小:31MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注