Python数据抓取技术与实战
本书特色
[
如何在大数据时代获得实时的数据信息,分析挖掘、提取出有价值的信息,并以直观清晰的图形表示出关键的数量关系和概念,是一个值得研究的问题。本书通过数据抓取篇(如何获得数据信息)、数据分析篇(分析挖掘,提取出有价值的信息)、数据可视化篇(以直观清晰的图形表示出关键的数量关系和概念)详细描述数据抓取、分析、展示的整个流程,每一篇自成一体,可以单独学习掌握。
]
内容简介
[
如何在大数据时代获得实时的数据信息,分析挖掘、提取出有价值的信息,并以直观清晰的图形表示出关键的数量关系和概念,是一个值得研究的问题。本书通过数据抓取篇(如何获得数据信息)、数据分析篇(分析挖掘,提取出有价值的信息)、数据可视化篇(以直观清晰的图形表示出关键的数量关系和概念)详细描述数据抓取、分析、展示的整个流程,每一篇自成一体,可以单独学习掌握。
]
目录
目 录第1章 Python基础1 1�保薄�Python安装1 1�保病“沧皃ip 6 1�保场∪绾尾榭窗镏�7 1�保础�**个程序10 1�保怠∥募�操作25 1�保丁⊙�环28 1�保贰∫斐#常� 1�保浮≡�组30 1�保埂×斜恚常� 1�保保啊∽值洌常� 1�保保薄〖�合38 1�保保病∷婊�数39目 录第1章 Python基础1 1�保薄�Python安装1 1�保病“沧皃ip 6 1�保场∪绾尾榭窗镏�7 1�保础�**个程序10 1�保怠∥募�操作25 1�保丁⊙�环28 1�保贰∫斐#常� 1�保浮≡�组30 1�保埂×斜恚常� 1�保保啊∽值洌常� 1�保保薄〖�合38 1�保保病∷婊�数39 1�保保场�enumerate的使用40 1�保保础〉诙�个例子41 第2章 字符串解析46 2�保薄〕S煤�数46 2�保病≌�则表达式50 2�保场�BeautifulSoup 55 2�保础�json结构62 第3章 单机数据抓取77 3�保薄〉セ�顺序抓取77 3�保病�requests 107 3�保场〔⒎⒑筒⑿凶ト。保保� 第4章 分布式数据抓取137 4�保薄�RPC的使用138 4�保病�Celery系统145 第5章 全能的Selenium 159 Ⅴ5�保薄�Selenium单机159 5�保病�Selenium分布式抓取178 5�保场�Linux无图形界面使用Selenium 188 第6章 神秘的Tor 191 6�保薄∽ト∈盜P封锁的问题191 6�保病�Tor的安装与使用192 6�保场�Tor多线程197 6�保础�Tor与Selenium结合205 第7章 抓取常见问题210 7�保薄�Flash 210 7�保病∽烂娉绦颍玻保� 7�保场�U盘213 7�保础《�级三级页面214 7�保怠⊥计�的处理214 7�保丁�App数据抓取214 第8章 监控框架221 8�保薄】蚣芩得鳎玻玻� 8�保病〖嗫叵低呈道�225 第9章 拥抱大数据229 9�保薄�Hadoop生态圈229 9�保病�Cloudera环境搭建231信息
封面
书名:Python数据抓取技术与实战
作者:潘庆和
页数:256
定价:¥49.0
出版社:电子工业出版社
出版日期:2016-08-01
ISBN:9787121298844
PDF电子书大小:122MB 高清扫描完整版
资源仅供学习参考,禁止用于商业用途,请在下载后24小时内删除!