11#
Fuller 管理员 发表于 2017-1-3 16:04:11 | 只看该作者
bennana 发表于 2017-1-3 12:09
微博评论连续动作0103-1
微博评论连续动作0103-2

第二级规则映射的不对,没有给回复内容做映射,应该做一个嵌套的整理箱,外层抓取普通的回复,内层也做样例复制,抓取回复的回复。

另外,第一级加载不成功,“回复数”是要抓取什么?
举报 使用道具
12#
bennana 中级会员 发表于 2017-1-3 17:52:59 | 只看该作者
Fuller 发表于 2017-1-3 16:04
第二级规则映射的不对,没有给回复内容做映射,应该做一个嵌套的整理箱,外层抓取普通的回复,内层也做样 ...

第一级规则是想做连续动作,点击“更多回复”。
第二级规则在修改后保存弹出“Error: unsupported node type:8”,并提示建立规则前冻结页面,无法保存,但是建立前已经勾选冻结页面是什么原因?
举报 使用道具
13#
Fuller 管理员 发表于 2017-1-3 18:07:05 | 只看该作者
bennana 发表于 2017-1-3 17:52
第一级规则是想做连续动作,点击“更多回复”。
第二级规则在修改后保存弹出“Error: unsupported node t ...

有可能会遇到网页上没有“更多回复”的情形,这样的话,点击就会失效,那么就没有机会执行第二级。所以,在第一级也要做整理箱,抓取回复内容。

可能是在定义规则过程中执行了刷新网页结构,造成节点定位错乱了。遇到这种情况只能重新做规则,保存不了也恢复不了,如果已经保存过规则,可以加载规则,分析页面
举报 使用道具
14#
bennana 中级会员 发表于 2017-1-4 11:23:04 | 只看该作者
Fuller 发表于 2017-1-3 18:07
有可能会遇到网页上没有“更多回复”的情形,这样的话,点击就会失效,那么就没有机会执行第二级。所以, ...

还是没有完成点击 第一级规则想点击微博评论中的”共*条回复“来查看一条评论下的所有回复。

举报 使用道具
15#
Fuller 管理员 发表于 2017-1-4 22:56:12 | 只看该作者
bennana 发表于 2017-1-4 11:23
还是没有完成点击 第一级规则想点击微博评论中的”共*条回复“来查看一条评论下的所有回复。

...

点击动作有高级设置,有一项“模拟点击”,勾上和不勾上都试试
举报 使用道具
16#
bennana 中级会员 发表于 2017-1-12 15:42:21 | 只看该作者
Fuller 发表于 2017-1-4 22:56
点击动作有高级设置,有一项“模拟点击”,勾上和不勾上都试试

评论回复的连续动作问题已解决,但是在规则1中尝试通过爬虫路线显示页面下方的更多评论不执行,如果连续动作和爬虫路线翻页都需要该怎么设定规则呢?需要分成两个规则吗?多谢解答!
举报 使用道具
17#
Fuller 管理员 发表于 2017-1-12 17:19:35 | 只看该作者
bennana 发表于 2017-1-12 15:42
评论回复的连续动作问题已解决,但是在规则1中尝试通过爬虫路线显示页面下方的更多评论不执行,如果连续 ...

如果连续动作和爬虫路线都定义了,先执行连续动作,再执行爬虫路线。

比如,先把这个网页上的连续点击都点击了一遍,才去翻页。

如果是做一下动作,然后要翻页抓取动作执行后的内容,那么就要做两个规则,动作前和动作后分开
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-21 02:01