大数据技术丛书R语言:实用数据分析和可视化技术(原书第2版)

本书特色

[

本书借鉴数据科学家Jared P. Lander在R语言上丰富的教学经验,通过大量实例,详细讲解R语言的核心功能。对于刚接触统计程序和模型的人,本书的内容组织结构使得学习R语言相当简单和直观。本书主要介绍R语言中20%的核心功能,但是这20%的功能足以让你解决80%的现代数据分析。
书中每一章都是从基础知识开始,提供大量的实例和代码。你将学习下载和安装R语言;设置和使用R语言环境;掌握基本的程序编写,数据导入、操作和可视化;完成几个测验。然后在此基础上,你将构建几个完整的模型,包括线性和非线性模型,学习数据挖掘技术。接着你将在代码中学习使用LaTeX,RMarkdown和Shiny等R语言包。

]

内容简介

[

本书借鉴数据科学家Jared P. Lander在R语言上丰富的教学经验,通过大量实例,详细讲解R语言的核心功能。对于刚接触统计程序和模型的人,本书的内容组织结构使得学习R语言相当简单和直观。本书主要介绍R语言中20%的核心功能,但是这20%的功能足以让你解决80%的现代数据分析。书中每一章都是从基础知识开始,提供大量的实例和代码。你将学习下载和安装R语言;设置和使用R语言环境;掌握基本的程序编写,数据导入、操作和可视化;完成几个测验。然后在此基础上,你将构建几个完整的模型,包括线性和非线性模型,学习数据挖掘技术。接着你将在代码中学习使用LaTeX,RMarkdown和Shiny等R语言包。

]

目录

译者序序前言致谢第1章 获取R语言 11.1 下载R语言 11.2 R语言版本 21.3 32位与64位 21.4 安装R语言 21.4.1 在Windows系统上安装 21.4.2 在Mac OS X系统上安装 51.4.3 在Linux系统上安装 81.5 微软开源R语言 101.6 小结 10第2章 R语言环境 112.1 命令行界面 122.2 RStudio 132.2.1 RStudio项目 142.2.2 RStudio工具 162.2.3 Git集成 202.3 微软Visual Studio 222.4 小结 22第3章 R语言包 233.1 安装R语言包 233.2 加载R语言包 253.3 构建R语言包 263.4 小结 26第4章 R语言基础 274.1 基本数学运算 274.2 变量 284.2.1 变量赋值 284.2.2 删除变量 294.3 数据类型 304.3.1 数值型 304.3.2 字符型 314.3.3 日期型 324.3.4 逻辑型 324.4 向量 344.4.1 向量操作 344.4.2 factor向量 374.5 函数调用 384.6 函数文档 384.7 缺失数据 394.7.1 NA 394.7.2 NULL 404.8 管道 404.9 小结 41第5章 高级数据结构 425.1 数据框 425.2 列表 485.3 矩阵 535.4 数组 565.5 小结 56第6章 R语言读取数据 576.1 读取CSV文件 576.1.1 read_delim函数 596.1.2 fread函数 606.2 读取Excel数据 606.3 读取数据库数据 626.4 读取其他统计工具的数据 646.5 读取R语言二进制文件 656.6 读取R语言数据 676.7 读取网页数据 686.7.1 读取HTML表格 686.7.2 抽取网页数据 696.8 读取JSON数据 706.9 小结 72第7章 统计图 737.1 基础统计图 737.1.1 基础直方图 747.1.2 基础散点图 747.1.3 箱线图 757.2 ggplot2 757.2.1 ggplot2:直方图和核密度曲线 767.2.2 ggplot2:散点图 777.2.3 ggplot2:箱线图和小提琴图 797.2.4 ggplot2:曲线图 827.2.5 主题 837.3 小结 84第8章 编写R语言函数 858.1 Hello,World! 858.2 函数参数 868.2.1 默认参数 878.2.2 额外参数 878.3 返回值 888.4 do.call函数 898.5 小结 89第9章 控制语句 909.1 if和else语句 909.2 switch语句 929.3 ifelse函数 949.4 复合检查 959.5 小结 95第10章 R语言的循环迭代 9610.1 for循环 9610.2 while循环 9710.3 控制循环 9810.4 小结 99第11章 分组操作 10011.1 apply函数族 10011.1.1 apply函数 10011.1.2 lapply和sapply函数 10111.1.3 mapply函数 10211.1.4 其他的apply函数 10211.2 aggregate函数 10311.3 plyr包 10511.3.1 ddply函数 10611.3.2 llply函数 10811.3.3 plyr的辅助函数 10911.3.4 速度与便利性 10911.4 data.table包 10911.4.1 键值 11311.4.2 data.table聚合 11511.5 小结 117第12章 高效的分组操作:dplyr 11812.1 管道 11812.2 tbl数据类型 11912.3 select函数 12012.4 f?ilter函数 12712.5 slice函数 13112.6 mutate函数 13212.7 summarize函数 13512.8 group_by函数 13612.9 arrange函数 13712.10 do函数 13712.11 dplyr使用数据库 13912.12 小结 140第13章 数据迭代 14113.1 map函数 14113.2 特定类型的map函数 14313.2.1 map_int函数 14413.2.2 map_dbl函数 14413.2.3 map_chr函数 14413.2.4 map_lgl函数 14513.2.5 map_df函数 14513.2.6 map_if函数 14613.3 数据框的迭代 14713.4 map函数的多输入 14813.5 小结 149第14章 数据整理 15014.1 cbind和rbind 15014.2 连接 15114.2.1 合并 15214.2.2 plyr中的join 15214.2.3 合并表 15614.3 reshape2 15714.3.1 melt函数 15714.3.2 dcast函数 15914.4 小结 160第15章 数据重构:Tidyverse 16115.1 合并行和列数据 16115.2 用dplyr包连接 16215.3 行列变换 16615.4 小结 169第16章 字符串操作 17016.1 paste 17016.2 把格式数据写成串(sprintf) 17116.3 提取文本 17216.4 正则表达式 17516.5 小结 181第17章 概率分布 18217.1 正态分布 18217.2 二项分布 18617.3 泊松分布 19017.4 其他分布 19217.5 小结 194第18章 基本统计 19518.1 概括性统计量 19518.2 相关系数和协方差 19818.3 t-检验 20518.3.1 单样本t-检验 20618.3.2 两样本t-检验 20818.3.3 两配对样本t-检验 21018.4 方差分析 21118.5 小结 213第19章 线性模型 21419.1 简单线性回归 21419.2 多元回归 21919.3 小结 234第20章 广义线性模型 23520.1 逻辑斯蒂回归 23520.2 泊松回归 23820.3 其他的广义线性模型 24120.4 生存分析 24220.5 小结 246第21章 模型诊断 24721.1 残差 24721.2 模型比较 25221.3 交叉验证 25521.4 Bootstrap 25921.5 逐步变量选择 26221.6 小结 264第22章 正则化和压缩 26522.1 弹性网络 26522.2 贝叶斯压缩 27922.3 小结 282第23章 非线性模型 28323.1 非线性*小二乘法 28323.2 样条插值 28523.3 广义相加模型 28823.4 决策树 29323.5 boost树 29523.6 随机森林 29823.7 小结 299第24章 时间序列和自相关 30124.1 自回归移动平均模型 30124.2 向量自回归 30624.3 广义自回归异方差模型 31124.4 小结 317第25章 聚类 31825.1 k-均值 31825.2 PAM 32525.3 分层聚类 32925.4 小结 332第26章 模型拟合调优:caret 33326.1 caret介绍 33326.2 caret选项 33326.2.1 caret训练控制 33426.2.2 caret网格搜索 33426.3 boost树调优 33526.4 小结 338第27章 可重复性报告:knitr 33927.1 安装LaTeX 33927.2 LaTeX基础 34027.3 knitr中使用LaTeX 34227.4 小结 346第28章 R语言文档:RMarkdown 34728.1 文档编译 34728.2 文档头信息 34728.3 Markdown入门 34828.4 Markdown代码块 35028.5 htmlwidgets 35128.5.1 表数据 35228.5.2 leaflet 35428.5.3 dygraphs 35628.5.4 threejs 35828.5.5 d3heatmap 36028.6 RMarkdown幻灯片 36128.7 小结 362第29章 交互式dashboard:Shiny 36329.1 在RMarkdown中使用Shiny 36329.2 Shiny中的响应表达式 36629.3 服务端和UI界面 36829.4 小结 376第30章 构建R包 37730.1 目录结构 37730.2 包文件 37830.2.1 DESCRIPTION文件 37830.2.2 NAMESPACE文件 38030.2.3 其他包文件 38230.3 包文档 38430.4 测试 38630.5 包的检查、构建和安装 38830.6 提交至CRAN 38930.7 C 代码 39030.7.1 sourceCpp 39030.7.2 编译包 39230.8 小结 394附录A 相关资源 395

封面

大数据技术丛书R语言:实用数据分析和可视化技术(原书第2版)

书名:大数据技术丛书R语言:实用数据分析和可视化技术(原书第2版)

作者:[美]贾里德P.德(Jared P.La

页数:452

定价:¥139.0

出版社:机械工业出版社

出版日期:2018-01-01

ISBN:9787111633624

PDF电子书大小:149MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注