机器学习与R语言

本书特色

[

r本身是一款十分优秀的数据分析和数据可视化软件。《机器学习与r语言》通过将实践案例与核心的理论知识相结合,提供了你开始将机器学习应用到你自己项目中所需要的知识。《机器学习与r语言》主要内容:机器学习的基本概念和理论,用于机器学习的r软件环境;如何应用r来管理数据,进行数据的探索分析和数据可视化;典型的机器学习算法和案例,并给出了详细的分析步骤;模型性能评价的原理和方法;提高模型性能的几种常用方法;其他机器学习主题。《机器学习与r语言》适用于任何希望使用数据来采取行动的人。读者只需要具有r的一些基本知识,不需要具备机器学习的深厚基础。不管是r初学者,还是熟练的r用户都能从书中找到对自己有用的内容。

]

目录

 推荐序译者序前言致谢关于技术评审人第1章机器学习简介1.1机器学习的起源1.2机器学习的使用与滥用1.3机器如何学习1.3.1抽象化和知识表达1.3.2一般化1.3.3评估学习的成功性1.4将机器学习应用于数据中的步骤1.5选择机器学习算法1.5.1考虑输入的数据1.5.2考虑机器学习算法的类型1.5.3为数据匹配合适的算法1.6使用r进行机器学习1.7总结 第2章数据的管理和理解2.1r数据结构2.2向量2.3因子2.3.1列表2.3.2数据框2.3.3矩阵和数组2.4用r管理数据2.4.1保存和加载r数据结构2.4.2用csv文件导入和保存数据2.4.3从sql数据库导入数据2.5探索和理解数据2.5.1探索数据的结构2.5.2探索数值型变量2.5.3探索分类变量2.5.4探索变量之间的关系2.6总结 第3章懒惰学习——使用近邻分类3.1理解使用近邻进行分类3.1.1knn算法3.1.2为什么knn算法是懒惰的3.2用knn算法诊断乳腺癌3.2.1第1步——收集数据3.2.2第2步——探索和准备数据3.2.3第3步——基于数据训练模型3.2.4第4步——评估模型的性能3.2.5第5步——提高模型的性能3.3总结 第4章概率学习——朴素贝叶斯分类4.1理解朴素贝叶斯4.1.1贝叶斯方法的基本概念4.1.2朴素贝叶斯算法4.2例子——基于贝叶斯算法的手机垃圾短信过滤4.2.1第1步——收集数据4.2.2第2步——探索和准备数据4.2.3数据准备——处理和分析文本数据4.2.4第3步——基于数据训练模型4.2.5第4步——评估模型的性能4.2.6第5步——提升模型的性能4.3总结 第5章分而治之——应用决策树和规则进行分类5.1理解决策树5.1.1分而治之5.1.2c5.0决策树算法5.2例子——使用c5.0决策树识别高风险银行贷款5.2.1第1步——收集数据5.2.2第2步——探索和准备数据5.2.3第3步——基于数据训练模型5.2.4第4步——评估模型的性能5.2.5第5步——提高模型的性能5.3理解分类规则5.3.1独立而治之5.3.2单规则(1r)算法5.3.3ripper算法5.3.4来自决策树的规则5.4例子——应用规则学习识别有毒的蘑菇5.4.1第1步——收集数据5.4.2第2步——探索和准备数据5.4.3第3步——基于数据训练模型5.4.4第4步——评估模型的性能5.4.5第5步——提高模型的性能5.5总结 第6章预测数值型数据——回归方法6.1理解回归6.1.1简单线性回归6.1.2普通*小二乘估计6.1.3相关系数6.1.4多元线性回归6.2例子——应用线性回归预测医疗费用6.2.1第1步——收集数据6.2.2第2步——探索和准备数据6.2.3第3步——基于数据训练模型6.2.4第4步——评估模型的性能6.2.5第5步——提高模型的性能6.3理解回归树和模型树6.4例子——用回归树和模型树估计葡萄酒的质量6.4.1第1步——收集数据6.4.2第2步——探索和准备数据6.4.3第3步——基于数据训练模型6.4.4第4步——评估模型的性能6.4.5第5步——提高模型的性能6.5总结 第7章黑箱方法——神经网络和支持向量机7.1理解神经网络7.1.1从生物神经元到人工神经元7.1.2激活函数7.1.3网络拓扑7.1.4用后向传播训练神经网络7.2用人工神经网络对混凝土的强度进行建模7.2.1第1步——收集数据7.2.2第2步——探索和准备数据7.2.3第3步——基于数据训练模型7.2.4第4步——评估模型的性能7.2.5第5步——提高模型的性能7.3理解支持向量机7.3.1用超平面分类7.3.2寻找*大间隔7.3.3对非线性空间使用核函数7.4用支持向量机进行光学字符识别7.4.1第1步——收集数据7.4.2第2步——探索和准备数据7.4.3第3步——基于数据训练模型7.4.4第4步——评估模型的性能7.4.5第5步——提高模型的性能7.5总结 第8章探寻模式——基于关联规则的购物篮分析8.1理解关联规则8.2例子——用关联规则确定经常一起购买的食品杂货8.2.1第1步——收集数据8.2.2第2步——探索和准备数据8.2.3第3步——基于数据训练模型8.2.4第4步——评估模型的性能8.2.5第5步——提高模型的性能8.3总结 第9章寻找数据的分组——k均值聚类9.1理解聚类9.1.1聚类——一种机器学习任务9.1.2k均值聚类算法9.1.3用k均值聚类探寻青少年市场细分9.1.4第1步——收集数据9.1.5第2步——探索和准备数据9.1.6第3步——基于数据训练模型9.1.7第4步——评估模型的性能9.1.8第5步——提高模型的性能9.2总结 第10章模型性能的评价10.1度量分类方法的性能10.1.1在r中处理分类预测数据10.1.2深入探讨混淆矩阵10.1.3使用混淆矩阵度量性能10.1.4准确度之外的其他性能评价指标10.1.5性能权衡的可视化10.2评估未来的性能10.2.1保持法10.2.2交叉验证10.2.3自助法抽样10.3总结 第11章提高模型的性能11.1调整多个模型来提高性能11.2使用元学习来提高模型的性能11.2.1理解集成学习11.2.2bagging11.2.3boosting11.2.4随机森林11.3总结 第12章其他机器学习主题12.1分析专用数据12.1.1用rcurl添加包从网上获取数据12.1.2用xml添加包读/写xml格式数据12.1.3用rjson添加包读/写json12.1.4用xlsx添加包读/写microsoftexcel电子表格12.1.5生物信息学数据12.1.6社交网络数据和图数据12.2提高r语言的性能12.2.1处理非常大的数据集12.2.2使用并行处理来加快学习过程12.2.3gpu计算12.2.4部署*优的学习算法12.3总结  

封面

机器学习与R语言

书名:机器学习与R语言

作者:兰兹

页数:259

定价:¥69.0

出版社:机械工业出版社

出版日期:2015-03-01

ISBN:9787111491576

PDF电子书大小:138MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注