按照视频操作,一直未能成功采集二级信息。如需采集以下网址中公司的名称、邮箱、网址

https://www.wcaworld.com/directory/members/129875

有没有大神帮看下,采集时已登录。


举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2023-8-17 09:23

沙发
马涌河畔11 初级会员 发表于 2023-8-14 17:54:41 | 只看该作者
管理员在后台查询了一下,你截图中的2个任务名不存在:墨西哥海运代理,公司信息二级
任务不存在的情况下,技术人员就没法加载规则进行分析。
你是不是把任务删除了?

举报 使用道具
板凳
13560779512 初级会员 发表于 2023-8-15 10:47:46 | 只看该作者
马涌河畔11 发表于 2023-8-14 17:54
管理员在后台查询了一下,你截图中的2个任务名不存在:墨西哥海运代理,公司信息二级
任务不存在的情况下, ...

是的,删除了
举报 使用道具
地板
13560779512 初级会员 发表于 2023-8-15 11:58:01 | 只看该作者
马涌河畔11 发表于 2023-8-14 17:54
管理员在后台查询了一下,你截图中的2个任务名不存在:墨西哥海运代理,公司信息二级
任务不存在的情况下, ...

我重新做了一个采集,还是不成功,数据不匹配。

麻烦帮看下,谢谢。
举报 使用道具
5#
Fuller 管理员 发表于 2023-8-16 11:55:30 | 只看该作者
13560779512 发表于 2023-8-15 11:58
我重新做了一个采集,还是不成功,数据不匹配。

麻烦帮看下,谢谢。

首先要使用“冻结页面”功能,不然的话,在浏览器上一选择那个点击位置,就会加载内容,网页就变了。所以,要冻结以后再做规则。就是:加载好页面以后,点击右上角那个按钮


其次,加载了下一页以后,网页上就多了一个点击位置,所以,原先的翻页规则就不合适了,只点击第一个位置。由于在翻页那里无法自定xpath,那么就在连续动作工作台上定义点击动作,写的xpath应该参照下图最下面那个节点来定位点击位置。因为那个节点总是挨着要点击的位置,而且那个节点有一个id属性,很好定位


举报 使用道具
6#
13560779512 初级会员 发表于 2023-8-16 18:45:58 | 只看该作者
。是这样定义吗,但是采集第一页可以正常翻页,第二页之后就一直卡在翻页动不了了,麻烦帮看下什么问题,谢谢!
举报 使用道具
7#
13560779512 初级会员 发表于 2023-8-16 18:47:39 | 只看该作者
Fuller 发表于 2023-8-16 11:55
首先要使用“冻结页面”功能,不然的话,在浏览器上一选择那个点击位置,就会加载内容,网页就变了。所以 ...


是这样定义吗,这样采集的时候第一页可以正常翻页,第二页就卡在翻页那里动不了了,是我哪里设置错了吗?
举报 使用道具
8#
Fuller_test20230811 新手上路 发表于 2023-8-17 09:23:40 | 只看该作者
13560779512 发表于 2023-8-16 18:47
是这样定义吗,这样采集的时候第一页可以正常翻页,第二页就卡在翻页那里动不了了,是我哪里设置错了吗 ...

设置翻页实现不了,到第二页就不行了,要用连续点击动作实现翻页,因为在连续动作那里可以自定义xpath。点击动作的教程参看:https://www.gooseeker.com/doc/article-546-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 05:58