数据挖掘算法与R语言实现/肖海军

本书特色

[

本书在介绍R软件基本功能的基础上,介绍了数据挖掘十大经典算法的基本原理及相应的R语言实现范例,旨在使读者能够仿照范例快速掌握大数据分析的方法,从高维海量数据中挖掘有用的信息,使用合适的数据挖掘算法,解决实际问题。全书内容共12章,分别介绍R软件的使用方法、C4.5算法、k-means算法、CART算法、Apriori算法、EM算法、PageRank算法、AdaBoost算法、kNN算法、Naive Bayes算法、SVM算法及各算法的案例分析。本书理论部分简单明了,所有程序均经过R软件实际运行。本书各章自成体系,读者既可从头逐章学习,也可随意挑选自己需要的章节学习。读者可登录华信教育资源网www.hxedu.com.cn免费下载算法实例代码。本书既可作为高年级本科生、研究生相关课程的教材,也可作为不同领域数据分析人员的工具书,还可作为零基础读者的自学教材。

]

内容简介

[

本书在介绍R软件基本功能的基础上,介绍了数据挖掘十大经典算法的基本原理及相应的R语言实现范例,旨在使读者能够仿照范例快速掌握大数据分析的方法,从高维海量数据中挖掘有用的信息,使用合适的数据挖掘算法,解决实际问题。全书内容共12章,分别介绍R软件的使用方法、C4.5算法、k-means算法、CART算法、Apriori算法、EM算法、PageRank算法、AdaBoost算法、kNN算法、Naive Bayes算法、SVM算法及各算法的案例分析。本书理论部分简单明了,所有程序均经过R软件实际运行。本书各章自成体系,读者既可从头逐章学习,也可随意挑选自己需要的章节学习。读者可登录华信教育资源网www.hxedu.com.cn免费下载算法实例代码。本书既可作为高年级本科生、研究生相关课程的教材,也可作为不同领域数据分析人员的工具书,还可作为零基础读者的自学教材。

]

作者简介

[

肖海军,中国地质大学(武汉)数学与物理学院教授,中国数学学会会员,中国计算机学会高级会员,中国电子学会高级会员。

]

目录

目 录第1章 R软件的使用方法 11.1 R软件介绍和安装 11.1.1 R软件介绍 11.1.2 R软件的安装 11.1.3 R studio的安装 21.2 R语言基本运算 31.2.1 R语言的数值运算 31.2.2 R语言的向量 51.2.3 R语言的向量运算 61.3 R语言缺失数据 71.3.1 R语言缺失数据类型 71.3.2 R语言缺失数据识别 71.3.3 R语言缺失数据处理 81.4 矩阵的运算 81.4.1 矩阵建立 81.4.2 矩阵计算 101.4.3 矩阵分解 111.5 列表和数据框 121.5.1 列表介绍 121.5.2 数据框介绍 131.6 R软件的数据读/写 141.7 R软件包介绍 151.7.1 包的基础知识 151.7.2 自动安装包 151.7.3 通过硬盘加载包 161.7.4 常见包介绍 161.8 R语言的函数 161.8.1 循环结构 161.8.2 条件执行结构 171.8.3 自定义函数 181.9 R软件绘图功能介绍 191.9.1 高级绘图函数 201.9.2 低级绘图函数 221.9.3 用ggplot2包进行绘图 25第2章 C4.5算法 302.1 算法简介 302.2 算法基本原理 302.3 算法的R语言实现 332.3.1 ctree函数介绍 332.3.2 C4.5决策树的R语言实例 332.4 小结 35参考文献 36第3章 k-means算法 373.1 算法简介 373.2 算法基本原理 373.3 算法的R语言实现 393.3.1 kmeans函数介绍 393.3.2 k-means聚类的R语言实例 393.4 小结 41参考文献 42第4章 CART算法 444.1 算法简介 444.2 算法基本原理 444.2.1 CART算法的建树 444.2.2 CART算法的剪枝 454.2.3 算法过程实例 464.3 算法的R语言实现 484.3.1 rpart函数介绍 484.3.2 CART决策树的R语言实例 484.3.3 rpart函数的补充说明 504.4 小结 52参考文献 52第5章 Apriori算法 535.1 算法简介 535.2 算法基本原理 535.2.1 挖掘频繁模式和关联规则 535.2.2 Apriori算法 555.2.3 AprioriTid算法 615.2.4 挖掘顺序模式 645.2.5 Apriori算法的一种改进算法 655.3 算法的R语言实现算法 665.3.1 apriori函数介绍 665.3.2 Apriori模型 665.4 小结 68参考文献 68第6章 EM算法 706.1 算法简介 706.2 算法基本原理 716.2.1 基础理论 716.2.2 算法过程实例 716.3 算法的R语言实现 766.3.1 mclust函数介绍 766.3.2 EM标准模型的R语言实现 776.3.3 存在噪声的EM算法的R语言实现 796.3.4 EM算法应用于高斯混合模型(GMM) 816.3.5 EM算法应用于Iris数据集 846.4 小结 84参考文献 85第7章 PageRank算法 867.1 算法简介 867.2 算法基本原理 867.3 算法的R语言实现 897.3.1 page.rank函数介绍 897.3.2 igraph包实现PageRank算法 897.3.3 自定义PageRank算法的R语言实现 907.3.4 补充实例 917.4 小结 95参考文献 96第8章 AdaBoost算法 978.1 算法简介 978.2 算法基本原理 978.2.1 Boosting算法 978.2.2 AdaBoost算法 988.2.3 算法过程实例 1018.3 算法的R语言实现 1028.3.1 boosting函数介绍 1028.3.2 R语言实例 1028.4 小结 104参考文献 104第9章 kNN算法 1059.1 算法简介 1059.2 算法基本原理 1059.2.1 算法描述 1059.2.2 算法流程 1079.3 算法的R语言实现 1089.3.1 knn函数介绍 1089.3.2 利用class包中的knn函数建立模型 1089.3.3 kNN算法应用于Iris数据集 1099.3.4 kNN算法应用于Breast数据集 1119.4 小结 113参考文献 114第10章 Naive Bayes算法 11510.1 算法简介 11510.2 算法基本原理 11510.2.1 基础理论 11510.2.2 算法过程实例 11810.3 算法的R语言实现 12010.3.1 naiveBayes函数介绍 12010.3.2 利用e1071包中的naiveBayes函数建立模型 12010.3.3 算法拓展——其他改进的Naive Bayes算法 12110.4 小结 123参考文献 123第11章 SVM算法 12511.1 算法简介 12511.2 算法基本原理 12511.2.1 基础理论 12511.2.2 软间隔优化 12711.2.3 核映射 12911.2.4 SVM算法的过程 13011.2.5 SVC算法过程实例 13011.3 算法的R语言实现 13211.3.1 svm函数介绍 13211.3.2 标准分类模型 13311.3.3 多分类模型 13311.3.4 SVM回归 13411.3.5 SVM拓展包(kernlab包) 13511.3.6 SVM算法应用于Iris数据集(e1071包) 13511.3.7 SVM算法应用于Iris数据集(kernlab包) 13611.4 小结 137参考文献 138第12章 案例分析 13912.1 关联规则案例分析 13912.1.1 问题描述 13912.1.2 R语言实现过程 13912.1.3 不同参数的Apriori模型 14112.1.4 小结 14512.2 kNN算法案例分析 14512.2.1 问题描述 14512.2.2 R语言实现过程 14512.2.3 小结 14812.3 Naive Bayes算法案例分析 14912.3.1 问题描述 14912.3.2 R语言实现过程 14912.3.3 小结 15212.4 CART算法案例分析 15212.4.1 问题描述 15212.4.2 R语言实现过程 15212.4.3 小结 15912.5 AdaBoost算法案例分析 15912.5.1 问题描述 15912.5.2 R语言实现过程 15912.5.3 小结 16112.6 SVM算法案例分析 16212.6.1 问题描述 16212.6.2 R语言实现过程 16212.6.3 小结 167

封面

数据挖掘算法与R语言实现/肖海军

书名:数据挖掘算法与R语言实现/肖海军

作者:肖海军

页数:180

定价:¥45.0

出版社:电子工业出版社

出版日期:2018-11-01

ISBN:9787121339370

PDF电子书大小:125MB 高清扫描完整版



本文标题:《数据挖掘算法与R语言实现/肖海军》PDF下载

资源仅供学习参考,禁止用于商业用途,请在下载后24小时内删除!