大数据技术与应用专业规划教材云计算与大数据技术理论及应用/林伟伟

本书特色

[

内容新颖先进;内容涉及*的云计算与雾计算技术,大数据的新技术平台、新应用案例和生物信息计算示例等;
知识系统全面:从传统的经典分布式计算原理开始,系统地、深入剖析新兴的云计算、雾计算和大数据的技术原理;
技术深入易学:通过大量的编程案例和应用开发实践让读者更容易学习和深刻理解相关技术原理、技术开发与应用方法;

]

内容简介

[

内容新颖优选;内容涉及很新的云计算与雾计算技术,大数据的新技术平台、新应用案例和生物信息计算示例等;
知识系统全面:从传统的经典分布式计算原理开始,系统地、深入剖析新兴的云计算、雾计算和大数据的技术原理;
技术深入易学:通过大量的编程案例和应用开发实践让读者更容易学习和深刻理解相关技术原理、技术开发与应用方法;

]

目录

目录第1章绪论1.1分布式计算概念1.1.1定义1.1.2优缺点1.1.3经典的分布式计算项目1.2分布式计算模式1.2.1单机计算1.2.2并行计算1.2.3网络计算1.2.4对等计算1.2.5集群计算1.2.6网格计算1.2.7云计算1.2.8雾计算1.2.9边缘计算1.2.10大数据计算1.3CAP定理1.3.1CAP定理历史1.3.2CAP定理应用1.3.3CAP问题的实例习题第2章分布式计算编程基础2.1进程间通信2.1.1进程间通信概念2.1.2IPC原型与示例2.2Socket编程2.2.1Socket概述2.2.2流式Socket编程2.3RMI编程2.3.1RMI概述2.3.2RMI基本分布式应用2.4P2P编程习题第3章云计算原理与技术3.1云计算概述3.1.1云计算起源3.1.2云计算的概念与定义3.1.3云计算与分布式计算3.1.4云计算分类3.2云计算关键技术3.2.1体系结构3.2.2数据存储3.2.3计算模型3.2.4资源调度3.2.5虚拟化3.3Google云计算原理3.3.1GFS3.3.2MapReduce3.3.3BigTable3.3.4Dremel3.4亚马逊云服务3.4.1亚马逊云平台存储架构3.4.2EC2、S3、SimpleDB等组件3.5基于亚马逊云的大数据分析案例3.5.1亚马逊云平台存储架构3.5.2亚马逊云的Web服务器日志大数据分析案例3.6阿里云3.6.1飞天开放平台架构3.6.2开放云计算服务ECS3.6.3开放存储服务OSS和CDN3.6.4开放结构化数据服务OTS3.6.5关系型数据库(RDS)3.6.6开放数据处理服务(ODPS) 习题第4章云计算编程实践4.1CloudSim体系结构和API介绍4.1.1CloudSim体系结构4.1.2CloudSim 3.0 API介绍4.2CloudSim环境搭建和使用方法4.2.1环境配置4.2.2运行样例程序4.3CloudSim扩展编程4.3.1调度策略的扩展4.3.2仿真核心代码4.3.3平台重编译4.4CloudSim的编程实践4.4.1CloudSim任务调度编程4.4.2CloudSim网络编程4.4.3CloudSim能耗编程4.5MultiRECloudSim4.5.1MultiRECloudSim体系结构和原理4.5.2MultiRECloudSim的API4.5.3MultiRECloudSim的使用方法4.6云环境任务调度编程实践4.6.1云计算的资源管理4.6.2云任务调度模拟实验习题第5章云存储技术5.1存储基础知识5.1.1存储组网形态5.1.2RAID5.1.3磁盘热备5.1.4快照5.1.5数据分级存储概念5.2云存储概念与技术原理5.2.1分布式存储5.2.2存储虚拟化5.3对象存储技术5.3.1对象存储架构5.3.2传统块存储与对象存储5.3.3对象5.3.4对象存储系统组成5.4存储技术趋势5.4.1存储虚拟化5.4.2固态硬盘5.4.3重复数据删除5.4.4语义化检索5.4.5存储智能化5.4.6混合存储系统习题第6章大数据技术原理与平台6.1大数据概述6.1.1大数据产生的背景6.1.2大数据的定义6.1.3大数据的4V特征6.2大数据存储平台6.2.1HDFS6.2.2HBase6.2.3Cassandra6.2.4Redis6.2.5MongoDB6.3大数据计算模式6.3.1MapReduce6.3.2Spark6.3.3流式计算6.4典型大数据分析管理平台6.4.1Cloudera Impala6.4.2Hortonworks Data Platform6.4.3HadoopDB6.5大数据并行计算编程实践6.5.1基于MAPREDUCE程序实例(HDFS)6.5.2基于MAPREDUCE程序实例(HBase)6.5.3基于Spark的程序实例6.5.4基于Impala的查询实践6.6大数据研究与发展方向6.6.1数据的不确定性与数据质量6.6.2跨领域的数据处理方法的可移植性6.6.3数据处理的时效性保证——内存计算6.6.4对于流式数据的实时处理6.6.5大数据应用6.6.6大数据发展趋势习题第7章实时医疗大数据分析案例7.1案例背景与需求概述7.1.1背景介绍7.1.2基本需求7.2设计方案7.2.1ETL7.2.2非格式化存储7.2.3流处理7.2.4训练模型与结果预测7.3环境准备7.3.1节点规划7.3.2软件选型7.4实现方法7.4.1使用Kettle/Sqoop等ETL工具,将数据导入HDFS7.4.2基于Spark Streaming开发Kafka连接器组件7.4.3基于Spark MLlib开发数据挖掘组件7.5不足与扩展习题第8章保险大数据分析案例8.1案例背景与需求概述8.1.1背景介绍8.1.2基本需求8.2设计方案8.2.1基于GraphX的并行家谱挖掘算法8.2.2基于分片技术的随机森林算法8.2.3基于内存计算的FP�睪rowth关联规则挖掘算法8.3环境准备8.4实现方法8.4.1基于GraphX的并行家谱挖掘8.4.2基于分片技术的随机森林模型用户推荐8.4.3基于FP�睪rowth关联规则挖掘算法的回归检验8.4.4结果可视化8.5不足与扩展习题第9章基于Spark聚类算法的网络流量异常检测9.1基本需求与数据说明9.1.1基本需求9.1.2数据说明9.2设计方案9.2.1聚类问题描述9.2.2系统整体架构和算法设计9.2.3数据预处理9.2.4聚类算法9.2.5聚类质量评估算法9.2.6检测算法9.3实现方法和程序设计9.3.1搭建Spark集群实验平台9.3.2程序运行说明9.3.3数据预处理9.3.4基于R的数据分析和可视化9.3.5聚类算法9.3.6聚类质量评估9.3.7异常检测9.4结果展示9.4.1Spark平台说明与作业提交演示9.4.2聚类算法及其质量评估9.4.3有效性分析9.4.4示例说明9.5展望习题第10章基于Hadoop的宏基因组序列比对计算10.1相关背景介绍与基本需求10.1.1相关背景10.1.2基本需求10.2设计方案10.2.1串行程序分析10.2.2并行程序设计10.3实现方法10.3.1自定义Hadoop Streaming Inputformat10.3.2修改SOAPaligner程序的输入文件函数10.4环境建立和实验数据说明10.4.1案例环境10.4.2实验数据10.5结果展示10.5.1测试方法10.5.2测试结果和分析习题第11章基于细胞反应大数据的生物效应评估计算11.1相关背景介绍与基本需求11.1.1相关背景11.1.2基本需求11.2设计方案11.2.1基本思路11.2.2设计框架11.3环境建立和实验数据说明11.3.1案例环境11.3.2实验数据11.4实现方法11.4.1算法分析11.4.2基因谱两两比对——富集积分矩阵并行化计算11.4.3基因谱聚类分析——KMedoids算法并行化11.5结果展示11.5.1基因谱两两比对——计算富集积分矩阵实验分析11.5.2基因谱聚类实验分析习题第12章基于Spark的海量宏基因组聚类问题分析计算12.1相关背景介绍与基本需求12.1.1相关背景12.1.2基本需求12.2问题分析与设计方案12.2.1问题分析12.2.2设计方案12.3实现方法12.3.1基于Spark的相似基因对问题的实现12.3.2利用LSH加速相似基因对算法12.3.3基因图的生成12.3.4图的基本性质分析12.3.5基因图聚类12.4环境建立和实验数据说明12.4.1案例环境12.4.2实验数据12.5结果展示12.5.1LSH方法精确度分析12.5.2可扩展性分析和加速效果分析12.5.3基因图顶点的度分布和连通性分析12.5.4基因图聚类结果分析12.5.5总结习题参考文献

封面

大数据技术与应用专业规划教材云计算与大数据技术理论及应用/林伟伟

书名:大数据技术与应用专业规划教材云计算与大数据技术理论及应用/林伟伟

作者:林伟伟、彭绍亮

页数:469

定价:¥89.0

出版社:清华大学出版社

出版日期:2018-05-01

ISBN:9787302524458

PDF电子书大小:67MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注