951#
960221WXX 新手上路 发表于 2019-10-28 21:55:06 | 只看该作者
可以了
举报 使用道具
952#
sdt110 中级会员 发表于 2019-11-5 17:08:45 | 只看该作者
高级搜索可以添加原创这个选项吗?同时需要微博发布的地址,应该怎么操作啊
举报 使用道具
953#
cystory 初级会员 发表于 2019-11-7 16:06:42 | 只看该作者
为啥博主里面有2万多条微博,结果只爬了100条?https://www.weibo.com/u/2061858797
举报 使用道具
954#
Fuller 管理员 发表于 2019-11-7 16:30:56 | 只看该作者
cystory 发表于 2019-11-7 16:06
为啥博主里面有2万多条微博,结果只爬了100条?https://www.weibo.com/u/2061858797

原因可能是:https://www.gooseeker.com/doc/thread-10945-1-1.html
https://www.gooseeker.com/doc/thread-13145-1-1.html


这个博主的博文比较多,最好按月采集,http://gooseeker.com/doc/thread-6507-1-1.html


举报 使用道具
955#
1608975342 新手上路 发表于 2019-11-9 00:24:11 | 只看该作者
一直显示采集中,请问如何处理
举报 使用道具
956#
Fuller 管理员 发表于 2019-11-9 07:09:22 | 只看该作者
1608975342 发表于 2019-11-9 00:24
一直显示采集中,请问如何处理

打数机窗口是什么状态?如果打数机窗口已经停止工作了,可打包下载数据。
举报 使用道具
957#
lalaxiaoer 初级会员 发表于 2019-11-13 16:02:21 | 只看该作者
爬到的数据里博主发的内容如果比较多就会显示展开全文,而不是全部内容,这个怎么解决呀
举报 使用道具
958#
Fuller 管理员 发表于 2019-11-13 17:39:59 | 只看该作者
lalaxiaoer 发表于 2019-11-13 16:02
爬到的数据里博主发的内容如果比较多就会显示展开全文,而不是全部内容,这个怎么解决呀 ...

这里有个现成的快捷采集工具,需要进入到每篇博文,爬虫会自动点击展开全文:https://www.gooseeker.com/res/datadiy.html?category=%E7%A4%BE%E4%BA%A4&web=%E6%96%B0%E6%B5%AA%E5%BE%AE%E5%8D%9A&rule=%E5%BE%AE%E5%8D%9A%E5%8D%9A%E6%96%87%E5%B1%95%E5%BC%80%E5%85%A8%E9%83%A8%E9%87%87%E9%9B%86
举报 使用道具
959#
养猩猩的猪 初级会员 发表于 2019-11-24 22:24:00 | 只看该作者
您好,我想问微博全文过长,如何设置在爬虫的时候自动展开全文呢?
举报 使用道具
960#
养猩猩的猪 初级会员 发表于 2019-11-24 22:58:33 | 只看该作者
为什么我选择展开全文的爬虫    就一直显示错误   不能继续爬了呢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 10:47