目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
抓取内容空白,如何解决?
页面上有内容,测试时抓取内容空白,如何解决?
抓取内容为空
在谋数台点测试的时候,抓取内容为空,这是为什么
如何抓取class为数据序列的内容
比如 请问如何获取各个span的class属性,即txt1,txt2,txt3
“整理箱为空,请添加抓取内容”
[i=s] 本帖最后由 umsung 于 2017-9-27 17:15 编辑 [/i] 报错“整理箱为空,请添加抓取内容
因为前面的原因生成的抓取规则文件是空的。 跳过
遇到这个问题怎么办?
如何通过案例映射抓取结构不一致的内容
GREEN BOOK”分割成三段 [attach]11331[/attach] 这是对应的网页结构,后面两个#text的内容是空的[attach]11332[/attach] 这是示例2,他的内容被分成了6个部分 [attach]11334[/attach] 这是对应的网页结构,有6各个#text,其中一个为空 [attach]11333[/attach] 对于这样的结构(相同的div下 #text的数量并不固定,空白#text的出现没有规律),如何通过案例映射采集全部评论内容
如何抓取twitter标签内容
想抓取twitter特定标签的数据请问大佬有没有指点一下的:lol
整理箱不能为空,请添加抓取内容
整理箱相当于表格名称,是不抓任何信息的,只有整理箱节点时,点击保存规则是无效的,所以会出现下面的提示。attach]3911[/attach] [b]解决方法:[/b]在网页上标注想要采集的信息,这样就会自动在整理箱下面建立抓取内容字段;或者是在整理箱下面建立抓取内容字段并把网页信息做内容映射给它; [attach]3909[/attach]
关键内容为空
规则测试时,提示关键内容为空,需要设置关键内容,这种情况会不会影响采集?
如何抓取网页链接内的内容
下面的是一个网页列表,有很多个车型,我想要逐个点击每个车型,打开的页面的详细信息,是要怎么实现呢 [attach]2639[/attach]
如何抓取网页链接内的内容
如何抓取网页链接内的内容
提示“因为前面的原因生成的抓取规则文件是空的。跳过”是为什么?
[attach]8207[/attach]
如何按规定时间抓取内容?
如何按规定时间抓取内容?下面网址里 成交记录里 按时间抓取内容 比如只抓当前9月的内容 9月抓完停止不抓8月的 https://zxn.taobao.com
如何抓取主页的全文内容?
微博正文还是不完整的,但是快捷服务里的“微博全文展开”又只能针对页面中的单一微博,不能通过结构化页面批量生产 有没有什么快捷方法能够抓取一个博主的所有微博且是全文
如何在抓取内容中选择部分内容?用XPath吗?
假如一个text中包含了一大段话,而我只想选择其中的一部分内容,这应该怎么设置规则和写xpath好?