R统计应用开发实战

本书特色

[

本书的前5章是以基础知识和r软件为主体,因此包括了r基本知识、数据可视化、探索性数据分析和统计推断。基础知识部分会使用有趣的例子来加以说明,并且为后5章建立了框架。回归模型、线性和logistic回归被安排在前面,是应用部分*重要的研究热点。这种讨论实质上更普遍,而且这种方法也很容易应用于不同的领域。*后两章受到了breiman学校的启发,因此详细介绍了分类和回归树的现代方法,并且用实际的数据集进行了说明。

]

内容简介

[

《r统计应用开发实战》
用通俗易懂的语言对r在机器学习、数据挖掘等领域的应用进行深入浅出的讲解;
既涵盖统计学概念,又针对不同问题给出具体的r实现代码,为使用r语言进行统计应用开发提供系统指南

]

作者简介

[

作者简介
Prabhanjan Narayanachar Tattar 现就职于戴尔全球分析公司的客户服务分析部,担任班加罗尔大学的戴尔公司商业分析顾问。他有多年的R软件使用经验,并曾研发过gpk和ACSWR两个软件包,出版了《A Course in Statistics with R》。他还曾在IBS-GK Shukla青年生物统计学家奖(2005年)和Dr.U.S.Nair奖的评选中均获得青年统计学家的荣誉称号。

译者简介
程豪 中国人民大学统计学博士在读,主要研究方向为机器学习、数据挖掘、统计预测、社会网络及结构方程模型。他担任了10多个课题的主要负责人和研究员,合作发表论文6篇,并在“海峡两岸CATI与数据挖掘合作20周年暨第十届中国数据挖掘与商业智能研讨会”中做报告。2014年获得“汇丰杯”中国高校SAS数据分析大赛冠军。除本书外,还曾参与翻译《R语言编程艺术》。

]

目录

译者序前言第1章 数据特征  1.1 问卷调查及其组成部分  1.2 在计算机科学中的不确定性研究  1.3 r安装   1.3.1 使用r包   1.3.2 rsadbe——本书的r包   1.3.3 离散分布   1.3.4 离散均匀分布   1.3.5 二项分布   1.3.6 超几何分布   1.3.7 负二项分布   1.3.8 泊松分布  1.4 连续分布   1.4.1 均匀分布   1.4.2 指数分布   1.4.3 正态分布  1.5 本章小结 第2章 数据导入和导出  2.1 data.frame和其他格式数据   2.1.1 常数、向量和矩阵   2.1.2 列表对象   2.1.3 data.frame对象   2.1.4 表对象  2.2 函数read.csv、read.xls以及外来程序包  2.3 导出数据/图表   2.3.1 导出r对象   2.3.2 导出图表  2.4 管理一个r会话  2.5 本章小结 第3章 数据可视化  3.1 分类数据的可视化技术   3.1.1 条形图   3.1.2 点图   3.1.3 脊柱图、马赛克图   3.1.4 饼图和四折图  3.2 连续型变量数据的可视化   3.2.1 箱线图   3.2.2 直方图   3.2.3 散点图   3.2.4 帕累托图  3.3 ggplot概述  3.4 本章小结 第4章 探索性分析  4.1 基本汇总统计量   4.1.1 百分位数、四分位数和中位数   4.1.2 折页数   4.1.3 四分位极差  4.2 茎叶图  4.3 字母值  4.4 数据变换  4.5 袋状图:二元箱线图  4.6 耐抗线  4.7 平滑数据  4.8 中位数平滑  4.9 本章小结 第5章 统计推断  5.1 极大似然估计   5.1.1 可视化似然函数   5.1.2 寻找极大似然估计   5.1.3 使用fitdistr函数  5.2 置信区间  5.3 假设检验   5.3.1 二项式检验   5.3.2 比例检验和卡方检验   5.3.3 基于正态分布检验:单样本   5.3.4 基于正态分布检验:两样本  5.4 本章小结 第6章 线性回归分析  6.1 简单线性回归模型   6.1.1 随意选择参数会发生什么   6.1.2 建立一个简单线性回归模型   6.1.3 anova及置信区间   6.1.4 模型验证  6.2 多元线性回归模型   6.2.1 平均k个简单线性回归模型或建立一个多元回归模型   6.2.2 建立一个多元线性回归模型   6.2.3 多元线性回归模型的anova和置信区间   6.2.4 有用的残差图  6.3 回归诊断   6.3.1 杠杆点   6.3.2 影响点   6.3.3 dffits 和dfbetas  6.4 多重共线性问题  6.5 选择模型   6.5.1 逐步选择   6.5.2 基于准则的方法  6.6 本章小结 第7章 logistic回归模型  7.1 二元回归问题  7.2 probit回归模型  7.3 logistic 回归模型  7.4 模型验证和诊断   7.4.1 广义线性模型的残差图   7.4.2 广义线性模型的影响点和控制点  7.5 接收操作曲线  7.6 德国的信用甄别数据集的logistic回归  7.7 本章小结 第8章 正规化回归模型  8.1 过度拟合问题  8.2 回归样条   8.2.1 基函数   8.2.2 分段线性回归模型   8.2.3 自然三次样条函数和一般的b样条曲线  8.3 线性模型的岭回归  8.4  logistic回归模型的岭回归  8.5 再看模型评估  8.6 本章小结 第9章 分类与回归树  9.1 递归划分法   9.1.1 划分数据   9.1.2 **个树  9.2 构造回归树  9.3 构造分类树  9.4 德国信用数据集的分类树  9.5 树的修剪和完善  9.6 本章小结 第10章 分类与回归树及其他  10.1 分类与回归树的改进  10.2 bagging   10.2.1 bootstrap算法   10.2.2 bagging算法  10.3 随机森林  10.4 整合  10.5 本章小结  参考文献

封面

R统计应用开发实战

书名:R统计应用开发实战

作者:塔特尔

页数:240

定价:¥59.0

出版社:机械工业出版社

出版日期:2015-04-01

ISBN:9787111493471

PDF电子书大小:74MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注