4 6336

领英搜索结果抓取

shengchengx 于 2018-3-20 10:02 发表 [复制链接]
我新发布了一个采集规则:
领英搜索结果抓取


详细信息:
领英搜索结果抓取

希望大家喜欢!下载地址:
http://www.gooseeker.com/res/detail_321626.html
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-3-30 09:17

anniescy 新手上路 发表于 2018-3-30 07:00:28 | 显示全部楼层
运行该规则后错误。
线索编号:11043354
加载抓取规则遇到的错误:
无法定位容器 No.0
无法定位抓取内容 No.1 (情景2);XPath是.//*[@class=distance-badge ember-view]/text()[position()=3]
无法定位抓取内容 No.3 (情景2);XPath是text()[position()=3]
无法定位抓取内容 No.4 (情景2);XPath是.//*[@class=search-result__result-link loading disabled ember-view]/@id
无法定位抓取内容 No.5 (情景2);XPath是.//*[@class=search-result__result-link loading disabled ember-view]/@data-control-name

加载爬虫路线遇到的错误:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无法定位线索0;定位用XPath:<context>//*[.//text()=下一页 and @class=results-paginator ember-view]</context>。跳过!
举报 使用道具
anniescy 新手上路 发表于 2018-3-30 07:00:51 | 显示全部楼层
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无法定位记号
经检查,记号(下一页)不符合要求,原因:节点号不正确
举报 使用道具
maomao 论坛元老 发表于 2018-3-30 07:12:14 | 显示全部楼层
anniescy 发表于 2018-3-30 07:00
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无 ...

规则可能失效了,等技术检查一下,改好了,通知你
举报 使用道具
scraper 论坛元老 发表于 2018-3-30 09:17:47 | 显示全部楼层
anniescy 发表于 2018-3-30 07:00
接上:
无法定位网页内容,基于XPath://*[.//text()=下一页 and @class=results-paginator ember-view]
无 ...

可以重新下载更新一下试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 01:44