[百度网盘]网络爬虫项目实践 PDF

[百度网盘]网络爬虫项目实践 PDF

内容简介

本书共分8个项目,包括:爬虫简介、爬取网站表层页面、网页内容解析、爬取网站动态页面、认识和应对反爬虫、数据存储、并发下载等内容。

目录

项目1爬虫简介

任务1-1认识爬虫

任务1-2爬虫的实现流程

任务1-3网页请求原理

任务1-4爬虫环境搭建

小结

习题

项目2爬取网站表层页面

任务2-1爬取网站首页

任务2-2爬取图书检索页面

任务2-3爬取用户信息验证结果

任务2-4urllib库知识点扩充

任务2-5使用urllib3库爬取网站页面

任务2-6使用requests库爬取网页

小结

……