11#
Fuller 管理员 发表于 2023-10-15 10:39:19 | 只看该作者
2186667399 发表于 2023-10-14 20:05
我按您说的设置了,因为您让点击的位置标签名一样所以直接返回最外面一层了,我又设置了一个让他进入列表 ...

我上个帖子最后一张图,那个xpath的最后是[2],表示点击一组元素中的第二个元素,这个要写对,才能进入列表页
举报 使用道具
12#
2186667399 初级会员 发表于 2023-10-16 09:33:50 | 只看该作者
本帖最后由 2186667399 于 2023-10-16 10:08 编辑
Fuller 发表于 2023-10-15 10:39
我上个帖子最后一张图,那个xpath的最后是[2],表示点击一组元素中的第二个元素,这个要写对,才能进入列 ...

我按您说的实现了操作,但是只采集第一页的内容不会采集之后的内容是什么原因呢
不执行我设置的翻页动作
举报 使用道具
13#
Fuller 管理员 发表于 2023-10-16 10:36:52 | 只看该作者
2186667399 发表于 2023-10-16 09:33
我按您说的实现了操作,但是只采集第一页的内容不会采集之后的内容是什么原因呢
不执行我设置的翻页动作
...

没有发生翻页?还是翻页以后采集失败?
举报 使用道具
14#
2186667399 初级会员 发表于 2023-10-16 10:42:48 | 只看该作者
Fuller 发表于 2023-10-16 10:36
没有发生翻页?还是翻页以后采集失败?

没有发生翻页
举报 使用道具
15#
Fuller 管理员 发表于 2023-10-16 10:58:24 | 只看该作者

翻页那里不要勾模拟点击
举报 使用道具
16#
2186667399 初级会员 发表于 2023-10-16 11:05:43 | 只看该作者
本帖最后由 2186667399 于 2023-10-16 14:14 编辑
Fuller 发表于 2023-10-16 10:58
翻页那里不要勾模拟点击

不勾选模拟点击也不进行翻页啊,还是直接在第一页采集第一条数据
举报 使用道具
17#
Fuller 管理员 发表于 2023-10-16 15:49:13 | 只看该作者
2186667399 发表于 2023-10-16 11:05
不勾选模拟点击也不进行翻页啊,还是直接在第一页采集第一条数据

不勾模拟点击肯定是能翻页的
举报 使用道具
18#
2186667399 初级会员 发表于 2023-10-16 15:51:16 | 只看该作者
Fuller 发表于 2023-10-16 15:49
不勾模拟点击肯定是能翻页的

翻页是翻页了,但是不进行下一步啊,到第二页就一直验证规则,然后结束,不进入内部网页
举报 使用道具
19#
Fuller 管理员 发表于 2023-10-16 18:12:17 | 只看该作者
2186667399 发表于 2023-10-16 15:51
翻页是翻页了,但是不进行下一步啊,到第二页就一直验证规则,然后结束,不进入内部网页
...

那就不是翻页的问题了,前面我说了,翻页到后面,适应第一页的规则就不适应了,要么仔细研究页面结构有什么变化,以便定义出来一个通用的规则,要么为下一页定义一个同名任务,但是规则编号不一样。

目前第二种方法我没有试通,我正在研究网页结构有什么变化,期望做出来一个通用的规则
举报 使用道具
20#
Fuller 管理员 发表于 2023-10-17 08:56:30 | 只看该作者

蓝色框里的那个@class值,翻页以后就变了,这个元素对应第一列数据,采集规则中如果使用了这个@class值作为定位标志,翻到下一页就规则不适用了。为了避免使用这个定位标志,要设置成绝对定位,或者手工找一个合适的@class做定位映射。我采用了绝对定位。


使用绝对定位以后,规则的适应性会下降,所以,我给整理箱做上定位映射,而不使用样例复制的方法采集多条数据。参看教程:https://www.gooseeker.com/doc/article-533-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-12 10:34