目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
抓取内容空白,如何解决?
页面上有内容,测试时抓取内容空白,如何解决?
求助如何。无class无id,过滤空白td
如下如所示。 [attach]1634[/attach]
因为前面的原因生成的抓取规则文件是空的。 跳过
遇到这个问题怎么办?
小白问题:如何抓取页面中不规则url?
求问,我想要抓取的页面中url不是一行一个排列的,而是以图标的形式一行多个排列,用样例复制抓不全,主要抓取内容都在第二层。第一层网址是https://yyk.99.com.cn/zhejiang/,像抓取的内容是每个医院名称,作为下级线索。要如何解决呀?
如何按规定时间抓取内容?
如何按规定时间抓取内容?下面网址里 成交记录里 按时间抓取内容 比如只抓当前9月的内容 9月抓完停止不抓8月的 https://zxn.taobao.com
点击规则测试,提示: “因为前面的原因生成的抓取规则文件是空的,跳过
一级列表规则按教程配置后,点击规则测试,提示:因为前面的原因生成的抓取规则文件是空的,跳过”; 2.DS打数机抓取时,一级规则爬取无法翻页、并且本地查找不到一级规则的爬取的数据 二级、三级单独单搜结果,本地能查到,但数据结果只有一条记录一级列表自动翻页+链接下级线索 规则名:阿里巴巴联系方式数据抓取 2.二级链接一级列表+链接下级线索 规则名:阿里巴巴一级采集规则 3.三级链接二级链接,并抓取数据; 规则名:阿里巴巴三级采集规则 求大神解答!
页面不符合抓取规则时如何跳转下一页?
如题,规则名ConverseSelect下转ConverseOutlet,区域点进去不是每个区都有店铺,抓不到信息的时候gooseeker就停住了不能跳到下一页。没有页面信息的时候希望能直接跳转到下一页,如何做到?谢谢!
对于如下的内容,各位大神是如何制作规则抓取的?
不做模拟点击,内容又显示不出来。此外,对于板块中的内容,做样例复制的话,很容易出现第一个样例定位不到,导致规则出错。不做样例复制的话,也想不到用什么方法来抓取内容。[/b] 二、抓取多个标签内容。[attach]1583[/attach] [b]在制作规则的时候,为了方便,我直接对所有便签的大结点做内容映射。省去做样例复制的麻烦,另一方面,也避免出现空白页面,导致样例复制定位不到第一个而出错。但是在数据处理的时候,就比较麻烦了,抓到的内容都放在一起,如果想将标签分类,也没有更好的办法。
抓取内容为空
在谋数台点测试的时候,抓取内容为空,这是为什么
如何通过案例映射抓取结构不一致的内容
GREEN BOOK”分割成三段 [attach]11331[/attach] 这是对应的网页结构,后面两个#text的内容是空的[attach]11332[/attach] 这是示例2,他的内容被分成了6个部分 [attach]11334[/attach] 这是对应的网页结构,有6各个#text,其中一个为空 [attach]11333[/attach] 对于这样的结构(相同的div下 #text的数量并不固定,空白#text的出现没有规律),如何通过案例映射采集全部评论内容
提示“因为前面的原因生成的抓取规则文件是空的。跳过”是为什么?
[attach]8207[/attach]
如何抓取twitter标签内容
想抓取twitter特定标签的数据请问大佬有没有指点一下的:lol
如何抓取网页链接内的内容
下面的是一个网页列表,有很多个车型,我想要逐个点击每个车型,打开的页面的详细信息,是要怎么实现呢 [attach]2639[/attach]
如何抓取网页链接内的内容
如何抓取网页链接内的内容
【规则求助】如何对三个黑色框框内容进行同时抓取呢?
三个黑色框框内容如何进行同时抓取呢?piimg.com/588926/4bf7e4cae476f8ef.png[/img] 主题名:TmallSearchList 规则:List 过程:已经写好3号框的规则,并采集成功。内容映射1和2到同一个整理箱 提示”无法找到相邻DOM节点“ [img=1307,467]http://i1.piimg.com