hb20xx
一派掌门

[图书类] [IT与网络] [PDF] [网盘下载] 《用 Python 写网络爬虫》写个爬虫爬呀爬[pdf]

-->

《用 Python 写网络爬虫(第2版)》包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用 Scrapy 爬虫框架进行快速的并行抓取,以及使用 Portia 的 Web 界面构建网路爬虫。



链接:https://pan.quark.cn/s/3ffa3915bbe9


#1楼
发帖时间:2024-03-24 07:57:46   |   回复数:1
ak147
隐世仙人♂
感谢大大分享
1月前 #2楼
游客组