大数据架构详解-从数据获取到深度学习

本书特色

[

本书从架构、业务、技术三个维度深入浅出地介绍了大数据处理领域端到端的知识。主要内容包括三部分:**部分从数据的产生、采集、计算、存储、消费端到端的角度介绍大数据技术的起源、发展、关键技术点和未来趋势,结合生动的业界*新产品,以及学术界*新的研究方向和成果,让深奥的技术浅显易懂;第二部分从业务和技术角度介绍实际案例,让读者理解大数据的用途及技术的本质;第三部分介绍大数据技术不是孤立的,讲解如何与前沿的云技术、深度学习、机器学习等相结合。

]

内容简介

[

这是一个数据信息时代,每分每秒都在产生数不尽的数据。这些数据如何获取,有什么用途,如何与前沿的深度学习、机器学习等相结合,如何为我们所用,尽在本书中。

]

作者简介

[

朱洁,2008年加入华为,具有8年大数据研发管理经验,现任华为大数据服务首席规划师。专注于大数据服务平台建设、规划和实践应用,同时参与多项企业级大数据项目解决方案的规划、设计和实施工作,在深化大数据行业落地方面有诸多实践经验,对解读大数据垂直行业的技术创新与开发有诸多独到的见解和心得。罗华霖,2002年加入华为,华为大数据首席规划师,主导完成华为大数据平台DataSight和华为电信大数据解决方案SmartCare技术规划和架构设计,支持电信运营商数字化战略转型,完成浙江移动、上海联通、沙特STC等200 电信大数据解决方案项目落地。曾任华为软交换首席设计师,华为大型电信大数据解决方案SmartCare首席架构师。

]

目录

目 录**部分 大数据的本质第1章 大数据是什么 21.1 大数据导论 21.1.1 大数据简史 21.1.2 大数据现状 31.1.3 大数据与BI 31.2 企业数据资产 41.3 大数据挑战 51.3.1 成本挑战 61.3.2 实时性挑战 61.3.3 安全挑战 61.4 小结 6第2章 运营商大数据架构 7目 录**部分 大数据的本质第1章 大数据是什么 21.1 大数据导论 21.1.1 大数据简史 21.1.2 大数据现状 31.1.3 大数据与BI 31.2 企业数据资产 41.3 大数据挑战 51.3.1 成本挑战 61.3.2 实时性挑战 61.3.3 安全挑战 61.4 小结 6第2章 运营商大数据架构 72.1 架构驱动的因素 72.2 大数据平台架构 72.3 平台发展趋势 82.4 小结 8第3章 运营商大数据业务 93.1 运营商常见的大数据业务 93.1.1 SQM(运维质量管理) 93.1.2 CSE(客户体验提升) 93.1.3 MSS(市场运维支撑) 103.1.4 DMP(数据管理平台) 103.2 小结 11第二部分 大数据技术第4章 数据获取 144.1 数据分类 144.2 数据获取组件 144.3 探针 154.3.1 探针原理 154.3.2 探针的关键能力 164.4 网页采集 264.4.1 网络爬虫 264.4.2 简单爬虫Python代码示例 324.5 日志收集 334.5.1 Flume 334.5.2 其他日志收集组件 474.6 数据分发中间件 474.6.1 数据分发中间件的作用 474.6.2 Kafka架构和原理 474.7 小结 82第5章 流处理 835.1 算子 835.2 流的概念 835.3 流的应用场景 845.3.1 金融领域 845.3.2 电信领域 855.4 业界两种典型的流引擎 855.4.1 Storm 855.4.2 Spark Streaming 895.4.3 融合框架 1025.5 CEP 1085.5.1 CEP是什么 1085.5.2 CEP的架构 1095.5.3 Esper 1105.6 实时结合机器学习 1105.6.1 Eagle的特点 1115.6.2 Eagle概览 1115.7 小结 116第6章 交互式分析 1176.1 交互式分析的概念 1176.2 MPP DB技术 1186.2.1 MPP的概念 1186.2.2 典型的MPP数据库 1216.2.3 MPP DB调优实战 1316.2.4 MPP DB适用场景 1626.3 SQL on Hadoop 1636.3.1 Hive 1636.3.2 Phoenix 1656.3.3 Impala 1666.4 大数据仓库 1676.4.1 数据仓库的概念 1676.4.2 OLTP/OLAP对比 1686.4.3 大数据场景下的同与不同 1686.4.4 查询引擎 1696.4.5 存储引擎 1706.5 小结 171第7章 批处理技术 1727.1 批处理技术的概念 1727.2 MPP DB技术 1727.3 MapReduce编程框架 1737.3.1 MapReduce起源 1737.3.2 MapReduce原理 1737.3.3 Shuffle 1747.3.4 性能差的主要原因 1777.4 Spark架构和原理 1777.4.1 Spark的起源和特点 1777.4.2 Spark的核心概念 1787.5 BSP框架 2177.5.1 什么是BSP模型 2177.5.2 并行模型介绍 2187.5.3 BSP模型基本原理 2207.5.4 BSP模型的特点 2227.5.5 BSP模型的评价 2227.5.6 BSP与MapReduce对比 2227.5.7 BSP模型的实现 2237.5.8 Apache Hama简介 2237.6 批处理关键技术 2277.6.1 CodeGen 2277.6.2 CPU亲和技术 2287.7 小结 229第8章 机器学习和数据挖掘 2308.1 机器学习和数据挖掘的联系与区别 2308.2 典型的数据挖掘和机器学习过程 2318.3 机器学习概览 2328.3.1 学习方式 2328.3.2 算法类似性 2338.4 机器学习&数据挖掘应用案例 2358.4.1 尿布和啤酒的故事 2358.4.2 决策树用于电信领域故障快速定位 2368.4.3 图像识别领域 2368.4.4 自然语言识别 2388.5 交互式分析 2398.6 深度学习 2408.6.1 深度学习概述 2408.6.2 机器学习的背景 2418.6.3 人脑视觉机理 2428.6.4 关于特征 2448.6.5 需要有多少个特征 2458.6.6 深度学习的基本思想 2468.6.7 浅层学习和深度学习 2468.6.8 深度学习与神经网络 2478.6.9 深度学习的训练过程 2488.6.10 深度学习的框架 2488.6.11 深度学习与GPU 2558.6.12 深度学习小结与展望 2568.7 小结 257第9章 资源管理 2589.1 资源管理的基本概念 2589.1.1 资源调度的目标和价值 2589.1.2 资源调度的使用限制及难点 2589.2 Hadoop领域的资源调度框架 2599.2.1 YARN 2599.2.2 Borg 2609.2.3 Omega 2629.2.4 本节小结 2639.3 资源分配算法 2639.3.1 算法的作用 2639.3.2 几种调度算法分析 2639.4 数据中心统一资源调度 2719.4.1 Mesos Marathon架构和原理 2719.4.2 Mesos Marathon小结 2839.5 多租户技术 2849.5.1 多租户概念 2849.5.2 多租户方案 2849.6 基于应用描述的智能调度 2879.7 Apache Mesos架构和原理 2889.7.1 Apache Mesos背景 2889.7.2 Apache Mesos总体架构 2889.7.3 Apache Mesos工作原理 2909.7.4 Apache Mesos关键技术 2959.7.5 Mesos与YARN比较 3049.8 小结 305第10章 存储是基础 30610.1 分久必合,合久必分 30610.2 存储硬件的发展 30610.2.1 机械硬盘的工作原理 30610.2.2 SSD的原理 30710.2.3 3DXPoint 30910.2.4 硬件发展小结 30910.3 存储关键指标 30910.4 RAID技术 30910.5 存储接口 31010.5.1 文件接口 31110.5.2 裸设备 31110.5.3 对象接口 31210.5.4 块接口 31610.5.5 融合是趋势 32810.6 存储加速技术 32810.6.1 数据组织技术 32810.6.2 缓存技术 33510.7 小结 336第11章 大数据云化 33711.1 云计算定义 33711.2 应用上云 33711.2.1 Cloud Native概念 33811.2.2 微服务架构 33811.2.3 Docker配合微服务架构 34211.2.4 应用上云小结 34811.3 大数据上云 34811.3.1 大数据云服务的两种模式 34811.3.2 集群模式AWSEMR 34911.3.3 服务模式Azure Data Lake Analytics 35211.4 小结 354第三部分 大数据文化第12章 大数据技术开发文化 35612.1 开源文化 35612.2 DevOps理念 35612.2.1 Development和Operations的组合 35712.2.2 对应用程序发布的影响 35712.2.3 遇到的问题 35812.2.4 协调人 35812.2.5 成功的关键 35912.3 速度远比你想的重要 35912.4 小结 361信息

封面

大数据架构详解-从数据获取到深度学习

书名:大数据架构详解-从数据获取到深度学习

作者:朱洁

页数:372

定价:¥69.0

出版社:电子工业出版社

出版日期:2016-10-01

ISBN:9787121300004

PDF电子书大小:34MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注