本人小白一枚,刚学会爬数据,最近刚学会爬简单的数据,现在想爬一1级页面中,每个页面对应的2级链接页面数据,我知道是在创建规则整理箱中,创建获取分类数据和二级链接,然后点中二级链接,再给下级线索打钩
--回到爬虫路线----回到爬虫路线--起一个目标主题名,--,存规则--关闭MS某数台--再启动定义2级链接页面的规则,定义完之后存规则
之后回到“打数机”搜到了1级页面的规则和2级页面的规则,下面就不知道该咋弄了?教程上是写的运行一级页面会自动关联2级页面,但是我运行了一级页面之后,并没有显示二级页面,求大神解答
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2019-4-12 08:31

wangyong 版主 发表于 2017-8-4 16:22:17 | 显示全部楼层
一级规则和二级规则都是要分别运行
教程里写的一级页面自动关联二级页面,是指在一级页面抓到的二级页面链接自动给二级规则生成线索
执行完一级规则后,在打数机中右击二级规则名统计线索就可以看到一级规则为二级规则生成的线索数
现在在运行二级规则就开始抓第二级的数据了
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-12 00:22:09 | 显示全部楼层
如果通过采集一级页面,关联进去二级页面,只是一个窗口,没有连接,二级规则能否生效
举报 使用道具
Fuller 管理员 发表于 2019-4-12 08:31:09 | 显示全部楼层
goodhanbin 发表于 2019-4-12 00:22
如果通过采集一级页面,关联进去二级页面,只是一个窗口,没有连接,二级规则能否生效 ...

没有链接不能用层级采集,要用连续动作,关联结果文件的时候也不能像层级采集一样用网址,而是用clueid,表示都是同一个网址产生的。如果还想更精确,可以看actionno和actionvalue,记录了做第几个动作产生了下级。文件结构的描述参看:https://www.gooseeker.com/doc/article-352-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 23:29