本帖最后由 15829685819 于 2022-1-2 11:29 编辑

【任务名】妇产科第二层级RSL

【问题描述】
~_]19SV`HQNKF1B6328YV5P.png 想要爬取右上角的查看全部问诊的详情链接

SK9D`8YAS~~]96SQ4[LJ2VC.png 这是定位到的正确链接

TIH7NN}WA9RV37ULB00@G.png 但是测试的时候发现获得的不是正确的链接

选了绝对定位,也得不到正确的链接

【原因】出现这个问题是有好几个不同链接他们的class都是一样的,所以会直接通过class定位到别的链接
【求助】怎么区分相同的class定位,而且没有id ,用不了id定位,想问问XPath可以解决这个问题吗!
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2022-1-16 13:36

内容分析应用 金牌会员 发表于 2022-1-2 13:06:22 | 显示全部楼层
可以用@class做定位映射,选祖先节点中的某个:
那个“查看完整出诊信息”,可以用节点@class='container con-doctorvisit js-doctorvisit'
那个“查看更多评价”,可以用节点@class='wrap-container clearfix'
QQ截图20220102130605.png
举报 使用道具
15829685819 初级会员 发表于 2022-1-16 13:36:32 | 显示全部楼层
内容分析应用 发表于 2022-1-2 13:06
可以用@class做定位映射,选祖先节点中的某个:
那个“查看完整出诊信息”,可以用节点@class='container c ...

好的!谢谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 02:02