991#
songsong627 初级会员 发表于 2020-1-13 19:50:50 | 只看该作者
请问微博主页内容的搜集,最近日期的微博为什么抓取不到呢?昨天试了只能得到2019年5月份的微博内容,不能抓取2019年整年的内容嘛?
举报 使用道具
992#
Fuller 管理员 发表于 2020-1-13 21:11:56 | 只看该作者
songsong627 发表于 2020-1-13 19:50
请问微博主页内容的搜集,最近日期的微博为什么抓取不到呢?昨天试了只能得到2019年5月份的微博内容,不能 ...

你添加的网址是什么?

这个博主是不是有很多微博?如果太多,可以按年甚至按月分开添加网址
举报 使用道具
993#
songsong627 初级会员 发表于 2020-1-13 22:24:55 | 只看该作者
Fuller 发表于 2020-1-13 21:11
你添加的网址是什么?

这个博主是不是有很多微博?如果太多,可以按年甚至按月分开添加网址

添加的网址就是微博主页,确实有很多微博,2012、3年的微博抓去了很多,可我需要的是2019年的。请问怎样按年添加网址呢?谢谢~

举报 使用道具
994#
Fuller 管理员 发表于 2020-1-13 23:31:27 | 只看该作者
songsong627 发表于 2020-1-13 22:24
添加的网址就是微博主页,确实有很多微博,2012、3年的微博抓去了很多,可我需要的是2019年的。请问怎样 ...

在博主主页点“全部”,然后把链接添加到采集工具中。估计你没有点击全部,所以爬的都是热门
举报 使用道具
995#
yexiaozhu 新手上路 发表于 2020-1-28 05:41:14 | 只看该作者
请问,采集评论应该输哪个url地址呢?现在没有单独的页面了
举报 使用道具
996#
Fuller 管理员 发表于 2020-1-28 09:21:49 | 只看该作者
yexiaozhu 发表于 2020-1-28 05:41
请问,采集评论应该输哪个url地址呢?现在没有单独的页面了


点击这个位置,就能进入到每条微博的网页,这个网址是独立网址。如果你没有发现独立网址,可能你上的手机网站,是没有独立网址的。weibo.cn就是手机网站,应该上weibo.com
举报 使用道具
997#
不日远游 初级会员 发表于 2020-2-1 13:28:53 | 只看该作者
怎么一直闪退???
举报 使用道具
998#
Fuller 管理员 发表于 2020-2-1 13:36:30 | 只看该作者
不日远游 发表于 2020-2-1 13:28
怎么一直闪退???

爬虫软件一下就消失了吗?如果已经采集了很久微博数据,建议清除缓存。如果刚用不久,建议关闭360这样的安全卫士
举报 使用道具
999#
不日远游 初级会员 发表于 2020-2-1 14:28:05 | 只看该作者
程序自己退出了,又得重新打开,我用了好久了,清除缓存是在那里?
举报 使用道具
1000#
Fuller 管理员 发表于 2020-2-1 16:17:11 | 只看该作者
不日远游 发表于 2020-2-1 14:28
程序自己退出了,又得重新打开,我用了好久了,清除缓存是在那里?

这个帖子说了两种方法:一种是通过界面上的按钮,一种是手工彻底清除:https://www.gooseeker.com/doc/thread-4503-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 23:36