41#
HJLing 版主 发表于 2017-2-23 14:55:51 | 只看该作者
liuhu521 发表于 2017-2-23 12:37
很郁闷,在DS浏览器采集中打开页面速度不算慢,比我之前的BB-Primalush这个网站要快的,DS页面也没发现异 ...

自己看第二个规则有没有翻页 没有翻页就去加载规则看是不是翻页线索有问题

举报 使用道具
42#
ym 版主 发表于 2017-2-23 15:01:40 | 只看该作者
liuhu521 发表于 2017-2-23 12:37
很郁闷,在DS浏览器采集中打开页面速度不算慢,比我之前的BB-Primalush这个网站要快的,DS页面也没发现异 ...

规则没有问题,在第二页加载后也要等会儿才抓取的,并不是立马抓取的,这个跟超时时长这个参数设置有关。如果想要加快抓取,可以勾上定时器触发,详情说明看《怎么样优化DS打数机/爬虫参数提高抓取速度》
举报 使用道具
43#
liuhu521 初级会员 发表于 2017-2-24 09:28:56 | 只看该作者
ym 发表于 2017-2-23 15:01
规则没有问题,在第二页加载后也要等会儿才抓取的,并不是立马抓取的,这个跟超时时长这个参数设置有关。 ...

非常感谢,搞定了
举报 使用道具
44#
Portiken 初级会员 发表于 2018-1-18 08:49:27 | 只看该作者
这种翻页好像是无线翻页,怎么限定他停止呢?比如限定它刷新50次
举报 使用道具
45#
数据集 高级会员 发表于 2018-1-18 09:18:43 | 只看该作者
Portiken 发表于 2018-1-18 08:49
这种翻页好像是无线翻页,怎么限定他停止呢?比如限定它刷新50次

1,在DS打数机的菜单中选择,高级 -> 终点标志 -> 重复内容,勾上“重复内容”,抓完最后一页就会停止
2,要限制翻页次数,需要使用爬虫群采集,在爬虫群的调度设置中可以设置。参考《限制翻页次数》
举报 使用道具
46#
ysq5240 新手上路 发表于 2020-11-4 19:02:30 | 只看该作者
没有下一页也没有数字1、2、3翻页,需要鼠标点击下一个视频。利用相对相对线索,一直抓取同一页
举报 使用道具
47#
maomao 论坛元老 发表于 2020-11-4 19:08:54 | 只看该作者
ysq5240 发表于 2020-11-4 19:02
没有下一页也没有数字1、2、3翻页,需要鼠标点击下一个视频。利用相对相对线索,一直抓取同一页 ...

任务的名字是什么?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 15:21