1461#
13631050311_CLP 新手上路 发表于 2023-11-4 17:21:32 | 只看该作者
能不能爬微博发布的地址信息吖
举报 使用道具
1462#
jss347505454 初级会员 发表于 2023-11-6 17:28:35 | 只看该作者
请问什么时候可以升级,比如设定信息来源地域(信域)进行搜集
举报 使用道具
1463#
Fuller 管理员 发表于 2023-11-7 16:47:09 | 只看该作者
jss347505454 发表于 2023-11-6 17:28
请问什么时候可以升级,比如设定信息来源地域(信域)进行搜集

要求哪个微博采集工具升级?
举报 使用道具
1464#
17727541164 初级会员 发表于 2023-11-22 22:32:10 | 只看该作者
感恩。但是还需要地址的字段,希望快点可以上线
举报 使用道具
1465#
Fuller 管理员 发表于 2023-11-23 10:44:05 | 只看该作者
17727541164 发表于 2023-11-22 22:32
感恩。但是还需要地址的字段,希望快点可以上线

微博搜索结果页面上不显示地址,所以采集不了。需要你把搜索结果数据导出来以后,把每条微博的网址拷贝出来,批量加入这个快捷采集工具,采集一遍详情,就能采集到地址信息:https://www.gooseeker.com/res/rule_494.html
举报 使用道具
1466#
SHXX259 新手上路 发表于 2023-12-1 15:17:31 | 只看该作者
没有博主粉丝量这项数据了,非常难办。希望可以增加。
举报 使用道具
1467#
wangyong 版主 发表于 2023-12-1 16:15:41 | 只看该作者
SHXX259 发表于 2023-12-1 15:17
没有博主粉丝量这项数据了,非常难办。希望可以增加。

用的是哪个微博工具?
举报 使用道具
1468#
zhgaogaopa 初级会员 发表于 2024-1-5 02:13:17 | 只看该作者
把需要采集全文的网址整理出来,导入到这个快捷采集工具中:https://www.gooseeker.com/res/rule_494.html 您好,请问这个网址为什么显示是“404您访问的页面无法显示”,要如何把关键词微博的完整内容采集出来呢?
举报 使用道具
1469#
zhgaogaopa 初级会员 发表于 2024-1-5 02:17:39 | 只看该作者
另外,请问一下如果想用微博关键词采集5年的数据,分段时间粒度设置为多少比较好嘞?有没有建议?因为怕数据太多,采集时间太长,目前是想按30天设置,不知道合理吗?还是说一年一年采集,这样怕是数据更多
举报 使用道具
1470#
zhgaogaopa 初级会员 发表于 2024-1-5 02:20:13 | 只看该作者
另外想请教一下,如果用微博关键词采集5年的数据,分段时间粒度设置在多少比较合适呢?因为怕采集的时间才长,且如果数据太多后续清洗很麻烦,现在想设置在30天不知道合理吗?或者一年一年采集?这样数据是不是只会更多。。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-22 05:43