GooSeeker集搜客网络爬虫，简单高效的网页采集器

产品服务购买教程社区

目录

快捷采集

如何使用数据DIY采集数据

用法案例-采集微博关键词搜索

用法案例-采集微博博主主页

用法案例-采集知乎数据

用法案例-采集京东评论

去资源库下载规则采数据

用法案例-采集豆瓣影评

用法案例-采集马蜂窝游记

用法案例-采集安居客房源

用法案例-采集前程无忧岗位信息

用法案例-采集微博签到数据

用法案例-采集抖音短视频搜索结果

用法案例-下载商品图片

用法案例-采集天猫商品评论信息

用法案例-采集知乎关键词搜索结果

用法案例-采集微博博主主页内容

初级教程(新版)

核心名词

界面布局介绍

定义规则采数据

采集列表数据

翻页采集数据

下载采集结果

XML格式结果

添加/删除/激活网址

启动数据采集

多机并行采集

加载修改任务

深层采集

内容映射采链接

定位映射提高精度

定位映射采集列表

下载文件

下载弹窗显示的pdf文件

在Excel中插入图片

初级教程(老版)

爬虫的核心名词

采集网页数据

采集列表数据

设置翻页采集

查看数据结果

xml转为excel

添加/激活网址线索批量采集

DS打数机采集数据

规则的修改、另存、删除

采网址做层级采集

定位标志精确采集范围

定位标志采集列表数据

采集图片网址并下载图片

怎样优化DS打数机采集速度

xml文件结构怎么看

数据规则怎么看

采集流程规划-详细版

批量下载网页上的文件

新版采摘浏览器做规则操作

数据转Excel处理

xml转为excel

多层级采集结果合并

把图片导入到excel中

批量修改下载图片名称

xml文件结构怎么看

爬虫规则管理

规则的修改、另存、删除

添加/激活网址线索批量采集

主题、规则、整理箱、线索

高级教程(新版)

连续动作案例

自动搜索关键词

连续点击采集商品价格

滚屏采集瀑布流网页

鼠标悬停信息采集

自动选择下拉菜单

回退返回上级页面

自动搜索关键词时只用规则中的词

特殊网页内容的采集技巧

嵌套整理箱采集多层次数据

网络爬虫抓包功能

利用重加载防止采集中断

更多查看老版高级教程

高级教程(老版)

自定义xpath

如何得到网页信息的xpath

xpath基本知识培训

自定义xpath：精确采集

自定义xpath的问题集锦

连续动作概念

连续动作基础概念

连续动作的界面介绍

如何找到合适的连续动作组合

数据采集爬虫路线连续动作执行顺

连续动作案例

自动搜索关键词采集信息

自动点击采集京东商品价格

滚屏采集瀑布流网页信息

翻页采集悬浮窗信息

自动选择下拉菜单采集数据

把信息与动作步骤对应起来

设置自动返回上级页面

飞掠模式：追踪弹窗采数据

连续打码：破解各种验证码

为瀑布流网页清除老数据

放大或缩小页面

划定滚轮范围

刷新页面动作

采集INPUT的动态内容

自动点击抓取淘宝sku和价格

特殊网页内容的采集技巧

采集网页模块信息

采集网页html源码

嵌套样例复制

在同一个主题名下建立多个规则

爬虫自动换IP

翻页和模拟点击技巧

模拟点击采集评论

相对线索：点击数字翻页

没有数字、文本记号，如何翻页

翻页重复、死循环的解决方法

用爬虫群分布式高效采集

爬虫群介绍：快速采集模式

任务调度设置，用爬虫群快速采数

调度设置参数说明

如何设置周期定时采集

怎样增量抓数据

采集过程中登录网站

在浏览器上手工登录

DS自动登录：不用输入验证

DS自动登录：要输入验证码

爬虫关键知识拓展

HTML基础知识培训

XML基础知识培训

xpath基础知识培训

xpath进阶：精确采集

网页分析工具知识培训

问题集锦

翻页采集集锦

采集网址集锦

样例复制集锦

定位标志映射集锦

采集图片集锦

层级采集集锦

自定义xpath集锦

实战演练案例

亚马逊商品搜索及商品评论采集

网络图片采集下载

安居客房产信息采集

大众点评店铺信息采集

表格型数据采集

抓取中国知网论文数据

采集同一网站的不同网页结构信息

爬虫安装说明

Windows版爬虫软件安装说明

Mac版爬虫软件安装说明

关于集搜客

集搜客产品及服务概述

集搜客爬虫工作原理

企业版软件介绍

集搜客爬虫升级公告

如何使用快捷采集采集数据

如何使用直观标注

联系我们

在线客服：

联系电话：0755-26021359 / 86528616

服务时间：周一至周五 9:30-18:00

集搜客交流群

2000人群：点击加入

模糊搜索精确搜索

搜索热词：

抓取内容空白，如何解决？

页面上有内容，测试时抓取内容空白，如何解决？

抓取内容为空

在谋数台点测试的时候，抓取内容为空，这是为什么

如何抓取class为数据序列的内容

比如请问如何获取各个span的class属性，即txt1，txt2，txt3

“整理箱为空，请添加抓取内容”

[i=s] 本帖最后由 umsung 于 2017-9-27 17:15 编辑 [/i] 报错“整理箱为空，请添加抓取内容

因为前面的原因生成的抓取规则文件是空的。跳过

遇到这个问题怎么办？

如何通过案例映射抓取结构不一致的内容

GREEN BOOK”分割成三段 [attach]11331[/attach] 这是对应的网页结构，后面两个#text的内容是空的[attach]11332[/attach] 这是示例2，他的内容被分成了6个部分 [attach]11334[/attach] 这是对应的网页结构，有6各个#text，其中一个为空 [attach]11333[/attach] 对于这样的结构（相同的div下 #text的数量并不固定，空白#text的出现没有规律），如何通过案例映射采集全部评论内容

如何抓取twitter标签内容

想抓取twitter特定标签的数据请问大佬有没有指点一下的:lol

整理箱不能为空，请添加抓取内容

整理箱相当于表格名称，是不抓任何信息的，只有整理箱节点时，点击保存规则是无效的，所以会出现下面的提示。attach]3911[/attach] [b]解决方法：[/b]在网页上标注想要采集的信息，这样就会自动在整理箱下面建立抓取内容字段；或者是在整理箱下面建立抓取内容字段并把网页信息做内容映射给它； [attach]3909[/attach]

关键内容为空

规则测试时，提示关键内容为空，需要设置关键内容，这种情况会不会影响采集？

如何抓取网页链接内的内容

下面的是一个网页列表，有很多个车型，我想要逐个点击每个车型，打开的页面的详细信息，是要怎么实现呢 [attach]2639[/attach]

如何抓取网页链接内的内容

如何抓取网页链接内的内容

提示“因为前面的原因生成的抓取规则文件是空的。跳过”是为什么？

[attach]8207[/attach]

如何按规定时间抓取内容？

如何按规定时间抓取内容？下面网址里成交记录里按时间抓取内容比如只抓当前9月的内容 9月抓完停止不抓8月的 https://zxn.taobao.com

如何抓取主页的全文内容？

微博正文还是不完整的，但是快捷服务里的“微博全文展开”又只能针对页面中的单一微博，不能通过结构化页面批量生产有没有什么快捷方法能够抓取一个博主的所有微博且是全文

如何在抓取内容中选择部分内容？用XPath吗？

假如一个text中包含了一大段话，而我只想选择其中的一部分内容，这应该怎么设置规则和写xpath好？

上一页 1 2 3 ... 480 下一页

MetaSeeker盛大升级
首页
产品教程社区
支持
常见问题视频教程速查手册旧版社区
关于
公司简介产品功能服务购买联系方式
联系
邮箱：info@gooseeker.com
热线1：0755-86528616

热线2：0755-26021359

咨询：
关注官方微信

应用版本：V9.0 | 更新时间：2023年8月22日 | 隐私策略 | 应用权限 | 版权所有 © 2007-2023 GooSeeker 深圳市天据电子商务有限公司

粤ICP备11065265号-2

粤公网安备44030502004363号