规则名称:酒店行业   7XFA@Z$Y_A8{VF5AAPA)~8I.png ZFP$V6$[L@TY~%GP@ETBC(7.png 4L}`D_2N)KERYV}_PO@A@DN.png
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2019-5-22 15:54

Fuller 管理员 发表于 2019-5-22 09:47:46 | 显示全部楼层
这个规则没有删除吧?我怎么搜不到?
举报 使用道具
z_nang122 新手上路 发表于 2019-5-22 09:49:50 | 显示全部楼层
Fuller 发表于 2019-5-22 09:47
这个规则没有删除吧?我怎么搜不到?

有的,刚刚我重新做了一个上传了 还是不行
举报 使用道具
Fuller 管理员 发表于 2019-5-22 09:51:32 | 显示全部楼层
你用的样本网址是什么?加载规则看到的网页看到的是空白的,你把样本网址发出来吧
举报 使用道具
z_nang122 新手上路 发表于 2019-5-22 09:52:23 | 显示全部楼层
Fuller 发表于 2019-5-22 09:51
你用的样本网址是什么?加载规则看到的网页看到的是空白的,你把样本网址发出来吧 ...

https://hotel.qunar.com/render/ga_new.jsp#refresh=0
举报 使用道具
Fuller 管理员 发表于 2019-5-22 09:53:49 | 显示全部楼层
如果你是先在浏览器中做了一些点击和选择以后才看到了要的内容,那么就要观察地址输入栏中的网址,把这个网址拷出来,放在另一个浏览器中加载,如果显示的内容并不是你想要的内容,说明这是一个动态网址,不是独立可加载的网址,那么,光有一个针对看到的结果做的采集规则不够,还需要让爬虫模拟人的点击动作,把需要的内容点击出来才行。这样就要看高级教程,做点击动作了
举报 使用道具
z_nang122 新手上路 发表于 2019-5-22 10:06:21 | 显示全部楼层
Fuller 发表于 2019-5-22 09:53
如果你是先在浏览器中做了一些点击和选择以后才看到了要的内容,那么就要观察地址输入栏中的网址,把这个网 ...

是的,我发现在GOOSEEKER里面登录去哪儿网,只要一往下拉 其网址就会变 从https://hotel.qunar.com/city/beijing_city/#fromDate=2019-05-23&bs=&bc=%E5%BC%A0%E5%AE%B6%E7%95%8C&QHFP=ZSL_A120F07D&cityurl=&toDate=2019-05-24&from=hotellist 变成 https://hotel.qunar.com/render/ga_new.jsp#refresh=0 后面这个网址复制到其他游览器上确实打不开
举报 使用道具
Fuller 管理员 发表于 2019-5-22 10:20:01 | 显示全部楼层
z_nang122 发表于 2019-5-22 10:06
是的,我发现在GOOSEEKER里面登录去哪儿网,只要一往下拉 其网址就会变 从https://hotel.qunar.com/city/ ...

去哪儿20190522101725.png

我把网址中#后面的内容去掉了,能加载,这个是不是你要的网址?

如果是这个,你把这个网址在会员中心里面添加到你的规则中,而把那个不可用的网址从会员中心中删除,再运行爬虫,采集一次看看能否成功。添加网址的说明在这里,注意新版界面修改了,这里的截图暂时还没有改,不过操作大同小异:https://www.gooseeker.com/doc/thread-667-1-1.html

我觉得去哪儿有静态网址
举报 使用道具
Fuller 管理员 发表于 2019-5-22 10:24:10 | 显示全部楼层
添加20190522102305.png
我也观察到了,集搜客爬虫加载这个网页后,地址会变,所以,样本页面网址不能直接用,现在会员中心删除,然后添加正确的网址
举报 使用道具
Fuller 管理员 发表于 2019-5-22 10:27:13 | 显示全部楼层
这个网页动态程度太高,DS打数机菜单 配置-》延迟抓取 ,设置5秒,多等待一会,确保加载全了,同时 配置-》定时器触发,要勾上,又需要提高速度,否则,这个网页上的动态代码执行的没完没了,定时器触发可以不等待这些代码的执行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 03:53