leevian 新手上路 发表于 2019-2-5 11:17:38 | 显示全部楼层
Fuller 发表于 2019-2-5 08:01
有没有把窗口放大到最大?

放大最大了


2.jpg
举报 使用道具
知识产权 高级会员 发表于 2019-2-5 17:46:45 | 显示全部楼层

很不好意思给您造成困扰,我发现您用的是mac电脑,我用mac电脑测试了,这个快捷采集确实采集失败,我已经通知开发人员针对mac电脑进行调整了
举报 使用道具
知识产权 高级会员 发表于 2019-2-7 09:27:32 | 显示全部楼层
规则已经修改好了,可以采集了
举报 使用道具
wrq6117 新手上路 发表于 2019-2-11 22:57:57 | 显示全部楼层
Fuller 发表于 2018-12-25 15:09
你要采集的网址是什么?有没有用这个快捷采集试试?有两个快捷采集:
1,独立话题动态:https://www.goos ...

是用的 模板 可是爬不到数据 是我设置有问题吗

举报 使用道具
Fuller 管理员 发表于 2019-2-12 08:53:14 | 显示全部楼层
wrq6117 发表于 2019-2-11 22:57
是用的 模板 可是爬不到数据 是我设置有问题吗

你在集搜客浏览器中登录了知乎了吗?DS打数机窗口运行的时候,要处于放大状态,不要最小化。

你自己定义的规则?还是用这个快捷采集?
举报 使用道具
wrq6117 新手上路 发表于 2019-2-13 20:31:09 | 显示全部楼层
Fuller 发表于 2019-2-12 08:53
你在集搜客浏览器中登录了知乎了吗?DS打数机窗口运行的时候,要处于放大状态,不要最小化。

你自己定义 ...

快捷采集
举报 使用道具
Fuller 管理员 发表于 2019-2-14 10:20:28 | 显示全部楼层

刚才又把规则调整了一下,因为我发现有个网页类型采集不了。不知道是不是你遇到的网页类型。你可以再试试,如果还是失败,就把网址发出来我测试一下
举报 使用道具
Fuller 管理员 发表于 2019-2-14 11:39:18 | 显示全部楼层
双鱼是篇小说 发表于 2018-3-28 12:06
我按照你说的做了,选择了全部,然后采集到了44条数据 就这个动态话题 https://www.zhihu.com/topic/1973 ...

这个动态话题很特别,如果登录知乎以后看这个话题,可以看到是能编辑的,看来是一个公共可编辑的话题。

我把爬虫规则调整了一下,能够把这个类型的网页也能采集下来了。

话题结构.png
举报 使用道具
wrq6117 新手上路 发表于 2019-2-15 22:06:42 | 显示全部楼层
Fuller 发表于 2019-2-14 10:20
刚才又把规则调整了一下,因为我发现有个网页类型采集不了。不知道是不是你遇到的网页类型。你可以再试试 ...

https://www.zhihu.com/topic/19550917/unanswered 知乎独立话题等待回答采集   
https://www.zhihu.com/topic/19550917//top-answers知乎独立话题精华回答采集   
都是莫名显示已停止的状态
只有知乎独立话题动态内容采集   是可以采集的


举报 使用道具
wangyong 版主 发表于 2019-2-16 18:11:13 | 显示全部楼层
wrq6117 发表于 2019-2-15 22:06
https://www.zhihu.com/topic/19550917/unanswered 知乎独立话题等待回答采集   
https://www.zhihu.com/ ...

之前出现已停止是因为知乎网页修改了,现在采集规则同步修改了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 14:03