数据挖掘原理.算法与应用

本书特色

[

本书系统介绍了数据挖掘原理、技术、算法和应用。主要内容包括:数据挖掘的过程、数据存储的数据仓库、数据预处理技术和算法、异常数据检测技术和算法、数据分类算法和应用、数据聚类分析的算法及其应用、数据关联分析算法及其应用、模型的评估技术和算法、复杂数据的数据挖掘和技术。本书涵盖了数据挖掘过程的各方面技术、算法,在内容安排上将理论知识和工程技术应用有机结合,并介绍了许多数据挖掘的典型应用方法。

]

目录

目录出版说明前言第1章概述1��1从数据中获取知识1��2数据挖掘的基本概念1��3数据挖掘的发展历程1��4数据挖掘的功能和数据挖掘系统的分类1��4��1分类与回归1��4��2聚类分析1��4��3关联规则1��4��4时序模式1��4��5异常检测1��4��6数据挖掘系统的分类1��5数据挖掘的过程1��5��1数据挖掘的一般流程1��5��2跨行业数据挖掘标准过程1��6数据挖掘与其他学科的关系1��6��1数据挖掘与数据库知识发现1��6��2数据挖掘与数据库查询1��6��3数据挖掘与统计分析1��6��4数据挖掘与数据仓库1��6��5数据挖掘与联机分析处理1��6��6数据挖掘与人工智能、专家系统、机器学习1��7数据挖掘的应用和发展趋势1��7��1商业的数据挖掘1��7��2金融业的数据挖掘1��7��3欺诈侦测中的数据挖掘1��7��4DNA数据分析中的数据挖掘1��7��5电信业中的数据挖掘1��7��6科学和统计数据挖掘1��7��7数据挖掘系统和软件1��7��8数据挖掘的发展趋势1��8小结1��9习题第2章数据存储2��1关系数据集2��2数据仓库2��2��1数据仓库的概念和特点2��2��2数据仓库的数据组织2��2��3数据仓库的关键技术2��2��4数据仓库与数据挖掘的关系2��3NoSQL数据库2��3��1NoSQL概念与理论2��3��2NoSQL数据模型2��3��3NoSQL与关系数据库2��4分布式文件系统2��4��1分布式文件系统的历史2��4��2分布式文件系统的体系结构2��4��3谷歌文件系统(GoogleFS)2��4��4Hadoop分布式文件系统(HDFS)2��5小结2��6习题第3章数据预处理3��1数据预处理的必要性3��2数据清理3��2��1缺失数据处理方法3��2��2噪声数据平滑技术3��2��3时间相关数据的处理3��3数据集成3��3��1实体识别与匹配3��3��2冗余和相关分析3��3��3元组重复数据的检测3��3��4冲突数据的检测与处理3��4数据转换3��4��1数据标准化3��4��2数据泛化3��5数据归约3��5��1数据立方体聚集3��5��2维度归约3��5��3数据压缩3��5��4数值归约3��6数据离散化3��6��1分箱方法3��6��2直方图分析3��6��3基于熵的离散化3��6��4ChiMerge技术3��6��5人工划分分段3��7特征提取、选择和构造3��7��1特征提取3��7��2特征选择3��7��3特征构造3��8小结3��9习题第4章数据相似度与异常检测4��1相似度度量4��1��1对象与属性类型4��1��2相似度度量的定义4��1��3由距离度量变换而来的相似度度量4��1��4属性之间的相似度度量4��1��5对象之间的相似度度量4��2传统度量方法4��2��1二值属性的相似度度量4��2��2欧氏距离4��2��3余弦距离4��2��4Mahalanobis距离4��2��5Jaccard距离4��2��6海明距离4��3大数据度量方法4��3��1文档的Shingling4��3��2局部敏感散列算法4��4异常检测4��4��1基于统计的检测方法4��4��2基于距离的检测方法4��4��3基于密度的检测方法4��4��4基于聚类的检测方法4��4��5基于分类的检测方法4��4��6高维数据中的异常点检测4��5小结4��6习题第5章数据分类和预测5��1分类和预测的基本概念5��1��1准备数据5��1��2分类和预测方法的评估标准5��2决策树分类5��2��1ID3算法生成决策树5��2��2C4��5算法生成决策树5��2��3CART算法和Gini指标5��2��4决策树归纳的可扩展性5��2��5数据仓库与决策树5��2��6决策树和决策规则的局限性5��3贝叶斯分类5��3��1贝叶斯定理5��3��2朴素贝叶斯分类5��3��3贝叶斯信念网络5��3��4训练贝叶斯信念网络5��4神经网络5��4��1多层前馈神经网络5��4��2定义神经网络的拓扑结构5��4��3后向传播5��4��4后向传播和可理解性5��5其他分类方法5��5��1基于关联的分类方法5��5��2K-*近邻分类5��5��3基于案例推理5��5��4遗传算法5��5��5粗糙集方法5��5��6模糊集合方法5��6预测算法5��6��1预测算法分类5��6��2预测算法选择5��6��3线性和多元回归5��6��4非线性回归5��6��5其他回归模型5��7分类预测应用实例5��7��1样本选取5��7��2建立预测模型5��7��3模型评估5��7��4实用价值5��8小结5��9习题第6章数据聚类分析6��1基本概念6��1��1对聚类分析的要求6��1��2聚类分析方法分类6��2划分聚类算法6��2��1K-means算法(基于质心的技术)6��2��2K-medoids算法(基于代表对象的技术)6��3层次聚类算法6��3��1BIRCH算法6��3��2CURE算法6��3��3ROCK算法6��3��4Chameleon算法6��4基于密度的聚类算法6��4��1DBSCAN算法6��4��2OPTICS算法6��4��3DENCLUE算法6��5基于网格的聚类算法6��5��1STING算法6��5��2WaveCluster算法6��5��3CLIQUE算法6��6基于模型的聚类算法6��6��1EM算法6��6��2COBWEB算法6��6��3SOM算法6��7聚类评估6��7��1估计聚类趋势6��7��2确定簇数6��7��3测定聚类质量6��8聚类分析应用实例6��8��1问题理解与提出6��8��2数据收集与选择6��8��3数据预处理6��8��4应用K-means聚类算法建模6��9小结6��10习题第7章数据关联分析7��1数据关

封面

数据挖掘原理.算法与应用

书名:数据挖掘原理.算法与应用

作者:梁亚声

页数:322

定价:¥59.0

出版社:机械工业出版社

出版日期:2017-10-01

ISBN:9787111496328

PDF电子书大小:147MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注