大数据技术与应用丛书大数据项目实战

本书特色

[

本书讲解了一个大数据综合项目——招聘网站职位分析。全书共分为6章,内容分别是项目概述、搭建大数据集群环境、数据采集、数据预处理、数据分析与数据可视化。 本书附有配套资源,包括源代码、教学设计、教学课件等资源。同时为了帮助初学者更好地学习本书内容,还提供了在线答疑,欢迎读者关注。 本书适用于高等院校本、专科计算机相关专业大数据项目实训课程的教学,书中的具体项目,有助于读者综合运用大数据课程知识及各种工具软件,实现大数据分析全流程操作。

]

内容简介

[

本书讲解了一个大数据综合项目——招聘网站职位分析。全书共分为6章,内容分别是项目概述、搭建大数据集群环境、数据采集、数据预处理、数据分析与数据可视化。
本书附有配套资源,包括源代码、教学设计、教学课件等资源。同时为了帮助初学者更好地学习本书内容,还提供了在线答疑,欢迎读者关注。
本书适用于高等院校本、专科计算机相关专业大数据项目实训课程的教学,书中的具体项目,有助于读者综合运用大数据课程知识及各种工具软件,实现大数据分析全流程操作。

]

作者简介

[

江苏传智播客教育科技股份有限公司(简称传智播客)是一家致力于培养高素质软件开发人才的科技公司,“黑马程序员”是传智播客旗下高端IT教育品牌。

]

目录

第1章项目概述11.1项目需求和目标11.2预备知识21.3项目架构设计及技术选取21.4开发环境和开发工具介绍31.5项目开发流程3小结5第2章搭建大数据集群环境62.1安装准备62.1.1虚拟机安装与克隆62.1.2虚拟机网络配置192.1.3SSH服务配置252.2Hadoop集群搭建312.2.1JDK安装312.2.2Hadoop安装332.2.3Hadoop集群配置352.2.4Hadoop集群测试392.2.5通过UI界面查看Hadoop运行状态432.3Hive安装442.3.1Hive的安装模式442.3.2Hive的安装452.4Sqoop安装49小结52第3章数据采集533.1知识概要533.1.1数据源分类533.1.2HTTP请求过程543.1.3认识HttpClient573.2分析与准备573.2.1分析网页数据结构573.2.2数据采集环境准备593.3采集网页数据623.3.1创建响应结果JavaBean类623.3.2封装HTTP请求的工具类633.3.3封装存储在HDFS的工具类683.3.4实现网页数据采集70小结72目录大数据项目实战第4章数据预处理734.1分析预处理数据734.2设计数据预处理方案754.3实现数据的预处理764.3.1数据预处理环境准备764.3.2创建数据转换类774.3.3创建实现Map任务的Mapper类814.3.4创建并执行MapReduce程序834.4将数据预处理程序提交到集群中运行84小结91第5章数据分析925.1数据分析概述925.2Hive数据仓库925.2.1什么是Hive925.2.2设计Hive数据仓库935.2.3实现数据仓库955.3分析数据995.3.1职位区域分析995.3.2职位薪资分析1005.3.3公司福利分析1045.3.4职位技能要求分析105小结106第6章数据可视化1076.1平台概述1076.1.1系统介绍1076.1.2系统架构1076.2数据迁移1086.2.1创建关系型数据库1086.2.2通过Sqoop实现数据迁移1106.3平台环境搭建1126.3.1新建Maven项目1126.3.2配置pom.xml文件1146.3.3项目组织结构1176.3.4编辑配置文件1176.4实现图形化展示功能1236.4.1实现职位区域分布展示1246.4.2实现薪资分布展示1286.4.3实现福利标签词云图1326.4.4实现技能标签词云图1376.4.5平台可视化展示141小结142

封面

大数据技术与应用丛书大数据项目实战

书名:大数据技术与应用丛书大数据项目实战

作者:黑马程序员

页数:0

定价:¥39.0

出版社:清华大学出版社

出版日期:2020-03-01

ISBN:9787302550938

PDF电子书大小:36MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注