R语言可以很简单-达人迷-(第2版)

本书特色

[

R是一个开源、跨平台的编程语言,用于统计计算和绘图,特别是其社区开发的数以千计的扩展包为R增加了强大的和前瞻性的功能。数据分析与挖掘已经成为大数据时代重要的技能之一,而 R已经成为数据分析领域炙手可热的标志性语言。
本书作为业内外一致好评的 Dummies系列书籍之一,是供 R语言初学者学习的经典力作。本书通俗易懂地讲解了如何利用 R语言基本知识,包括创建、运行以及调试 R脚本,用户自定义 R函数,用 R绘制基本图形, R的循环语句和逻辑控制语句等,逐步引导读者迈入 R语言高手行列。
本书适用于数据分析人员以及对 R语言感兴趣的读者。

]

内容简介

[

你遇到过这种情况吗?工作中迫切需要使用R,但是对编程却了解的不多?不要害怕!这正是一本指导你如何将R用于统计和数据分析的简明读本。书中贯穿了许多现实生活中的例子以及循序渐进的练习,你可以学习到如何改造和操作数据、进行计算、实现可视化以及其他更多技能。
主要特色
R入门——获取和安装R,了解R的特性,比较不同的代码编辑器,并写出你的第1个R脚本。
关联其他软件——学习R是如何与Excel以及其他程序交互的,并了解为何R受到统计学家和数据分析人员的青睐。
R基础知识——使你的代码更简洁,并探索R的函数和参数。
计算方法——充分利用R的计算功能来处理数值、无穷数、缺失值、数学函数以及向量。
获取文本——使用特征向量创建并处理文本数据,并学习处理字符串和因子的方法。
探索数据的秘密——使用子集处理数据,运用不同方法合并数据,并用统计分析方法来分析数据。
绘图——借助散点图和点阵图实现数据可视化。
本书特别给出了20条有用的建议,包括如何用 R语言来做本可以使用微软 Excel来做的 10件事,以及10条关于使用非基础 R程序包的建议。

]

作者简介

[

作者简介
Andrie de Vries是Revolution Analytics公司的首席R专家和商业服务总监,有超过20年的R使用经验,为客户提供关于R的咨询和培训服务。Joris Meys是一位统计学家、R程序员和R讲师,就职于根特大学生物工程学院。
译者简介
李毅,韩国岭南大学理学博士,现为山西财经大学统计学院副教授,硕士生导师。研究方向为应用统计,主持国家自然基金、国家统计局重点课题等多项。发表学术论文20余篇,其中被SCI收录10余篇。

]

目录

**部分 R语言编程入门 1

第1章 R语言简介:全景图 3
认识到使用R语言的优势 5免费、开源代码 5可以在任何环境下运行 5R语言支持扩展 5拥有活跃的社区 5和其他语言的连接 6
R语言的独特之处 7向量的多项计算 7不仅仅是统计分析 8无需编辑直接运行 8

第2章 探索R 9
使用代码编辑器 10探索RGui 11用RStudio优化 13
开始**个R会话 15向世界说你好 15使用向量 15存储和计算值 16回馈用户 18启动一个脚本 18响应你的工作 20
导航环境 21操纵环境中的内容 21保存你的工作 21检索你的工作 22

第3章 R基础知识 23
充分利用函数的强大功能 23向量函数 24函数参数调用 25创建历史记录 27
保持代码的可读性 27遵循命名规则 28组织代码 30添加注释 32
R基础功能的扩展 32查找扩展包 32安装扩展包 33加载和卸载扩展包 33

第二部分 开始使用R 35
第4章 算术入门 37
数值、无穷值与缺失值 37基础运算的操作 38使用数学函数 40计算整个向量 43无穷及其以后 43
使用向量组织数据 45探索向量属性 45创建向量 48向量连接 48重复向量 49
向量值的存取 49理解R的索引 50从向量中提取数值 50修改向量的值 51
使用逻辑向量 52值的比较 53将逻辑向量作为索引 54逻辑表达式的组合 55逻辑向量小结 56
增强数学运算 56使用向量的数学运算 57参数循环 59

第5章 开始读和写 61
对文本数据使用字符向量 61为字符向量赋值 62创建包含多个元素的字符向量 62获取向量的子集 63为向量中的值命名 64
文本操作 66字符串理论:组合和分割字符串 66文本排序 69查找文本中包含的内容 70文本替换 72使用正则表达式 73
使用因子进行分类 76创建因子 76转换因子 77关注水平 79区分数据类型 80使用有序因子 81

第6章 使用R处理时间数据 83
处理日期 83
用不同的格式表示日期 85
添加时间 86
日期和时间的格式 88
操作日期与时间 88加法和减法 89日期的比较 89提取 90

第7章 高维数据的处理 93
添加第二个维度 93探索新维度 94将向量组合成矩阵 97
使用索引 98提取矩阵元素的值 98降低维度 100修改矩阵中的值 100
为矩阵行列命名 101修改行和列的名称 102将名称作为索引 103
矩阵的计算 103矩阵的基本运算 103行列求和 105矩阵运算 105
添加更多维度 107创建数组 107使用维度来提取数据 108
在数据框组合不同类型的值 109由矩阵创建数据框 109从零开始创建数据框 111命名变量和规则 112
操纵数据框中的值 113提取变量、观察值和元素值 114向数据框添加观测值 115向数据框添加变量 117
将不同类型的对象组合到列表中 118创建列表 119提取列表中的元素 120修改列表中的元素 122理解列表的str()输出结果 124透过树木看到森林 125

第三部分 编写R代码 127
第8章 探索函数的乐趣 129
从脚本到函数 129编写脚本 130转换脚本 130使用函数 131简化代码 133
巧妙地使用参数 134添加更多的参数 135点参数的魔力 136将函数作为参数 137处理作用域 140穿越边界 140
方法分配 142隐藏函数背后的方法 142实现自己的通用函数 144

第9章 控制逻辑流 146
使用“if”语句做出判断选择 147
用“if…else”语句实现另一种选择 149
判断选择的向量化 150查看问题 150基于逻辑向量进行判断 151
多种选择 152嵌套“if … else ”语句 153用switch处理多种选择 154
循环遍历 155构造一个“for”循环 155通过“for”循环来进行计算 156
无循环的循环:认识“Apply”家族函数 158“apply”函数的家族特征 159认识“apply”家族中的三个成员 159针对行和列使用apply函数 160将函数应用于与列表类似的对象上 162

第10章 调试代码 165
知道要查找什么 165
阅读错误信息和警告信息 166阅读错误信息 166注意警告信息(或者不) 167
查找漏洞 169logit计算 169了解错误的来源 169查找函数内部 170
自定义消息 174创建错误 174创建警告 175
一些常见的错误 175从错误的数据开始 176格式错误的数据 176

第11章 取得帮助 180
在R帮助文档中查找信息 180当我们明确地知道到底查找什么时 180当我们不知道到底要查找什么时 181
在互联网上查找R帮助文档 182
加入R社区 184在Stack Overflow和Stack Exchange讨论R 184使用R邮件列表 184在Twitter讨论R 185
实现*小可复现示例 185用随机数创建样本数据 186精简代码 187提供必要的信息 187

第四部分 让数据说话 189
第12章 导入和导出数据 191
导入数据到R中 191在R文本编辑器中录入数据 192使用剪贴板复制和粘贴 193从CSV文件中读取数据 195从Excel中读取数据 198处理其他数据类型 200
R中导出数据 201
使用文件和文件夹 202了解工作目录 202文件操作 204

第13章 操作和处理数据 207
确定*合适的数据结构 207
创建数据子集 208理解三种子集运算符 209理解取子集的五种方式 209提取数据框子集 210
在数据中添加计算域 214数据框的列运算 214使用with和within提高代码的可读性 215对数据进行分组 216
组合与合并数据集 217创建示例数据 218使用“merge()”函数 220使用查询表 221
数据排序 223对向量进行排序 224对数据框进行排序 224
使用“apply”函数遍历数据 227使用“apply()”函数汇总数组 228使用“lapply()”和“sapply()”来遍历列表或数据框 229使用“tapply()”创建表格汇总数据 230
了解公式接口 232
规范数据的格式 234理解数据的长格式和宽格式 234初识reshape2包 235将数据转换为长格式 236将数据重塑宽格式 237

第14章 数据汇总 240
从正确的数据开始 241使用因子或数值 241唯一值计数 242准备数据 242
描述连续变量 243讨论数据的中心 243描述变异性 244计算分位数 244
描述分类 245计数 246计算比例 246查找中心 247
描述分布 248绘制直方图 248使用频率和密度 249
描述多元变量 251完整数据集的汇总 251绘制子集的分位数 252记录相关性 254
使用表格 257创建双向表 257将表格转换为数据框 258边际与比例 259

第15章 差异与关联检验 261
仔细研究分布 262
观察海狸 262正态分布的图形检验 262使用分位图 263使用公式法检验正态性 265
比较两个样本 267差异检验 267比较成对数据 269
检验频数和比例 270检验比例 270表格分析 271提取检验结果 273
使用模型 273方差分析 274计算差异 276线性关系建模 278线性模型评估 280预测新值 282

第五部分 绘制图形 285
第16章 使用基本图型 287
创建不同类型的数据图 287数据图概览 287向数据图添加点和线 288各种类型的数据图 292
控制数据图选项和参数 294添加标题和坐标轴标签 294修改数据图选项 295在单页中绘制多个数据图 298
将数据图保存成图片文件 299

第17章 使用lattice绘制切片图 301
创建lattice数据图 302加载lattice包 303制作lattice散点图 303添加趋势线 304
修改数据图的选项 306添加标题和标签 306修改标题和标签的字号 307使用主题修改数据图选项 308
绘制不同类型的数据图 309绘制柱状图 309绘制箱型图 310
绘制分组数据 311使用高格式数据 311绘制分组数据 313添加图例 313
输出和保存lattice数据图 314将lattice图赋予一个对象 315在脚本中输出lattice数据图 315将lattice数据图保存成文件 315

第18章 学习ggplot2制图 317
安装并加载ggplot2 317
认识层 318
使用geom和stat 319定义数据 319从数据映射到可视元素 320获得geom 321
了解stat 324
添加切片、标尺和选项 326添加切片 326修改选项 327
获取更多信息 329

第六部分 20条有用建议 331
第19章 10种用R不用Excel的情况 333
添加行和列的总和 333
格式化数据 334
数据排序 336
使用if进行选择 336
计算条件总和 337
列或行转置 337
查找唯一或重复值 338
使用检索表 339
利用数据透视表 339
使用单变量求解 340

第20章 关于程序包的10个技巧 343
探索CRAN 343
寻找有趣的程序包 344
安装程序包 344
加载程序包 345
阅读程序包的手册和文档 345
更新程序包 346
使用R-Forge 347
从github获取程序包 347
从Bioconductor进行安装 348
阅读R手册 348

附录A 安装R和RStudio 349
附录B rfordummies包 355
译后记 357

封面

R语言可以很简单-达人迷-(第2版)

书名:R语言可以很简单-达人迷-(第2版)

作者:安德里.德弗里斯

页数:358

定价:¥69.0

出版社:人民邮电出版社

出版日期:2017-07-01

ISBN:9787115455390

PDF电子书大小:124MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注