主题名:试验789  求解?

分页标记.png (1.6 KB, 下载次数: 371)

分页标记.png

分页源代码.png (7.55 KB, 下载次数: 374)

分页源代码.png
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2017-2-8 18:53

沙发
xandy 论坛元老 发表于 2017-2-8 18:05:36 | 只看该作者
可以参照这个帖子来解决:《没有文本记号进行翻页,要用什么匹配
举报 使用道具
板凳
xlt148107 初级会员 发表于 2017-2-8 18:11:15 | 只看该作者
xandy 发表于 2017-2-8 18:05
可以参照这个帖子来解决:《没有文本记号进行翻页,要用什么匹配》

看过了,但是没什么用啊,我选择用src来作为翻页标记,但是死循环采集第一页的信息
举报 使用道具
地板
xlt148107 初级会员 发表于 2017-2-8 18:11:29 | 只看该作者
xandy 发表于 2017-2-8 18:05
可以参照这个帖子来解决:《没有文本记号进行翻页,要用什么匹配》

看过了,但是没什么用啊,我选择用src来作为翻页标记,但是死循环采集第一页的信息
举报 使用道具
5#
cluetest 新手上路 发表于 2017-2-8 18:14:22 | 只看该作者
举报 使用道具
6#
xandy 论坛元老 发表于 2017-2-8 18:14:26 | 只看该作者
xlt148107 发表于 2017-2-8 18:11
看过了,但是没什么用啊,我选择用src来作为翻页标记,但是死循环采集第一页的信息
...

账号密码提供一下
举报 使用道具
7#
xandy 论坛元老 发表于 2017-2-8 18:15:14 | 只看该作者
cluetest 发表于 2017-2-8 18:14
试试相对线索翻页
http://www.gooseeker.com/doc/article-149-1.html

是的,也可以试试用相对线索
举报 使用道具
8#
Fuller 管理员 发表于 2017-2-8 18:25:12 | 只看该作者
这个网站需要登录才能看,所以,无法诊断规则。如果翻页循环,要检查翻页规则的正确性,在爬虫路线工作台上点击“查看规则”
举报 使用道具
9#
cluetest 新手上路 发表于 2017-2-8 18:53:43 | 只看该作者
我想到的是一个笨方法:
第1个规则:采集第1页的内容, 连续动作里点击第2页, 目标主题: 第2个规则
第2个规则:采集第2页的内容, 连续动作里点击第3页, 目标主题: 第3个规则
...
第9个规则:采集第9页的内容, 连续动作里点击第10页, 目标主题: 第10个规则
第10个规则:采集第10页的内容, 连续动作里点击"next 10 pages", 目标主题: 第1个规则
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 15:48