211#
tzx2015 初级会员 发表于 2016-8-6 09:42:47 | 只看该作者
Fuller 发表于 2016-8-5 21:09
你是用哪个工具?关键词搜索工具本身就要输入时间段信息。

我想采集某一个月的微博博主主页的发帖内容
举报 使用道具
212#
Fuller 管理员 发表于 2016-8-6 09:46:19 | 只看该作者
tzx2015 发表于 2016-8-6 09:42
我想采集某一个月的微博博主主页的发帖内容

微博工具箱是一个便捷工具,没有那么灵活,博主主页消息列表不能按照时间进行截取,要么抓第一页,要么翻页抓到底。

即使自己写规则,也无法选时间段,但是可以指定页码
举报 使用道具
213#
weir7811 新手上路 发表于 2016-8-8 22:07:23 | 只看该作者
本帖最后由 weir7811 于 2016-8-8 22:09 编辑

各位高人,我布置了一个任务,显示完成了,但是数据打包那一项是灰色的,无法点打包数据是怎么回事,拜谢了C:\Users\Administrator\Desktop\1.bmp

1.jpg (49.17 KB, 下载次数: 509)

1.jpg
举报 使用道具
214#
Fuller 管理员 发表于 2016-8-8 22:18:20 | 只看该作者
weir7811 发表于 2016-8-8 22:07
各位高人,我布置了一个任务,显示完成了,但是数据打包那一项是灰色的,无法点打包数据是怎么回事,拜谢了 ...

明天上班我让工程师帮你看看,如果真的采集到数据了,不会丢失的。你现在可以继续采集
举报 使用道具
215#
Fuller 管理员 发表于 2016-8-9 10:29:38 | 只看该作者
weir7811 发表于 2016-8-8 22:07
各位高人,我布置了一个任务,显示完成了,但是数据打包那一项是灰色的,无法点打包数据是怎么回事,拜谢了 ...

你再刷新一下页面试试?如果有问题请回复
举报 使用道具
216#
humankong 新手上路 发表于 2016-8-10 20:22:15 | 只看该作者
不好意思,那个bug貌似还存在啊(T-T)。我用的工具是“微博粉丝与关注者资料采集工具”。出现的问题是数据采集完后,“打包”按钮还是灰色的。我后来重新安装的软件还是这样。我还故意隔了一段时间再尝试,结果还是如此。
举报 使用道具
217#
ippfon 版主 发表于 2016-8-11 14:53:01 | 只看该作者
humankong 发表于 2016-8-10 20:22
不好意思,那个bug貌似还存在啊(T-T)。我用的工具是“微博粉丝与关注者资料采集工具”。出现的问题是数据 ...

可以尝试删除采集任务后,再重新添加一次
注意:使用粉丝和关注者采集工具时,暂时不要将同一个微博网址同时添加为俩个采集任务,如果想重复采集一个微博博主的粉丝/关注者,可以删除上一个采集任务后,再次添加。
后续会尽快修改更新这些问题,感谢你的热心反馈
举报 使用道具
218#
karrow 新手上路 发表于 2016-8-13 10:03:57 | 只看该作者
抓了一下评论,600多页,抓了两小时还没完,除了有点慢,其他还能接受。就是要处理xml文本又继续下工具扣积分啥的。还是充值吧。
举报 使用道具
219#
YolaHhh 新手上路 发表于 2016-8-22 15:35:42 | 只看该作者
您好,我觉得咱们这个产品特别好,不过想问一个基础的东西,就是这个采集工具只能对现有数据进行抓取是吧
?也就是说,如果用户把去年7月的某个微博删了,那我现在抓取,只能抓取去年7月还在的微博对吗?~谢啦!
希望咱们的这样的好产品能够越做越好!
举报 使用道具
220#
Fuller 管理员 发表于 2016-8-22 16:21:23 | 只看该作者
YolaHhh 发表于 2016-8-22 15:35
您好,我觉得咱们这个产品特别好,不过想问一个基础的东西,就是这个采集工具只能对现有数据进行抓取是吧
? ...

只能抓看到的。为了能保留尽量多的内容,要持续不断地抓取,即增量抓取。

抓历史数据总是不全,微博的搜索功能进行了过滤,如果每隔10分钟抓一次,得到的内容远远多于搜索历史数据
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-20 05:55