11#
2186667399 初级会员 发表于 2023-10-10 16:41:20 | 只看该作者
Fuller 发表于 2023-10-10 16:37
第一级规则加载不成功,你重新加载规则,能成功吗?

我看到网页上提示要登录,你登录了才定义的规则? ...

我没有提示加载不成功啊,我按教程里面连续动作按钮来做的,没有进行重新加载规则啊
举报 使用道具
12#
Fuller 管理员 发表于 2023-10-10 17:09:24 | 只看该作者
2186667399 发表于 2023-10-10 16:41
我没有提示加载不成功啊,我按教程里面连续动作按钮来做的,没有进行重新加载规则啊
...

你那个规则应该是运行不成功的。这个表很特别,可能会横向滚动,一滚动,html的元素就变了。

如果在第一级只是为了做点击,那么只采集第一列作为定位标志就行了。定义规则之前不要横向滚动,确保是原始模样



用第一列的那个span节点做内容映射。再做一个定位标志映射,用上图圈出来的那个@class属性做定位映射。这样就能准确地采集出第一列。

点击很容易做,只需要点击每一行的任何位置就行



xpath是://*[@class='el-table__row'] 。这是每一行的xpath

到了第二级还要做一个动作,要选择“回退”类型的动作,才能退回第一级
举报 使用道具
13#
2186667399 初级会员 发表于 2023-10-10 17:19:01 | 只看该作者
Fuller 发表于 2023-10-10 17:09
你那个规则应该是运行不成功的。这个表很特别,可能会横向滚动,一滚动,html的元素就变了。

如果在第一 ...

您最后说的要选择“回退”类型的动作是什么意思,您能教我一下吗
举报 使用道具
14#
Fuller 管理员 发表于 2023-10-10 18:48:11 | 只看该作者
2186667399 发表于 2023-10-10 17:19
您最后说的要选择“回退”类型的动作是什么意思,您能教我一下吗

在第二级规则里面,要用退回动作将页面回退到第一级


举报 使用道具
15#
2186667399 初级会员 发表于 2023-10-11 14:20:54 | 只看该作者
Fuller 发表于 2023-10-10 18:48
在第二级规则里面,要用退回动作将页面回退到第一级

我问您一下我按您说的这个方法进行操作的话,能保证我把这个列表中每个食品种类都进入网页内采集下来吗,如果可以的话我开个会员进行采集,我想咨询您一下
举报 使用道具
16#
Fuller 管理员 发表于 2023-10-11 16:10:58 | 只看该作者
2186667399 发表于 2023-10-11 14:20
我问您一下我按您说的这个方法进行操作的话,能保证我把这个列表中每个食品种类都进入网页内采集下来吗, ...

这种网站是类似数据库一样的网站,很难采集全,一般网站都会设置一些措施防止数据被采集。目前,测试看来能采集,但是没法保证每个都采集到
举报 使用道具
17#
2186667399 初级会员 发表于 2023-10-11 16:40:42 | 只看该作者
本帖最后由 2186667399 于 2023-10-11 16:42 编辑
Fuller 发表于 2023-10-11 16:10
这种网站是类似数据库一样的网站,很难采集全,一般网站都会设置一些措施防止数据被采集。目前,测试看来 ...

那您能给我来个您测试采集到里面内容的截图吗,或者您给我来个测试码我试一下,如果可以的话,我购买进行采集,因为我不知道您所说的采集到的一部分是指哪一部分,所以我咨询您一下
我想看您进入到这个界面采集的结果,麻烦您一下

举报 使用道具
18#
2186667399 初级会员 发表于 2023-10-12 16:48:56 | 只看该作者
Fuller 发表于 2023-10-10 18:48
在第二级规则里面,要用退回动作将页面回退到第一级


问这是哪有错误导致进入不了网页内不呢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-9 10:35