有人用过集搜客爬虫软件吗?它的集微库如何
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-10-14 16:33

沙发
xandy 论坛元老 发表于 2016-10-14 16:33:10 | 只看该作者
意见领袖的定义是什么?具有什么特征?基于特征识别模型来判断,所以,识别意见领袖主要是一个基于模型计算判断的过程,这篇讨论很有参考价值:意见领袖是如何影响普通人的消费行为的? - 经济学

而集搜客网络爬虫在这类项目中只是解决微博数据的爬取问题。如果有了一个初步的特征模型,可以更加有选择地爬数据。即便还没有一个明确的模型,从微博上爬取如下方面的数据都会用于模型计算:
1,博主的粉丝和关注
2,博主的详细资料
3,博主发表的微博内容
4,爬转发和评论,用于统计博主参与的微博
5,爬#话题
6,根据关键词爬微博使用集微库-微博采集工具箱将上面的内容爬下来以后,基于特征模型对数据抽取和统计,也可能用更加复杂的算法,判断一个博主是否为意见领袖
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-10 16:42