有人爬过世界总统库么？

往后余生

如题世界总统库地址：世界总统库（男性）"https://www.worldpresidentsdb.com/list/gender/male/" 世界总统库（女性）"https://www.worldpresidentsdb.com/list/gender/female/"

我之前使用的是requests+xpath，但是爬取的时间太长，一共500多条数据，需要2800多秒，原因是需要访问每一个人的页面，然后进行解析，想知道有没有什么快捷的办法

Fuller · 发表于 2019-4-4 16:40:49

用集搜客网络爬虫试试，如果只运行一个线程的话，平均一个网页4秒以内完成。如果网站不封锁，可以启动爬虫群模式，用多个线程同时爬。

针对这个网站，做一个层级采集规则，我看需要两级规则就可以了。

fs7374527 · 发表于 2019-11-29 16:19:03

https://www.gooseeker.com/doc/article-200-1.html

有人爬过世界总统库么？

共 2 个关于本帖的回复最后回复于 2019-11-29 16:19

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

有人爬过世界总统库么？

共 2 个关于本帖的回复 最后回复于 2019-11-29 16:19

推荐板块

精彩推荐

热门话题

热门用户

共 2 个关于本帖的回复最后回复于 2019-11-29 16:19