本帖最后由 ym 于 2018-3-23 14:26 编辑

集搜客分词打标软件 > 使用介绍

集搜客分词打标软件是一款在线文本分词应用,不用安装软件,操作非常简单,下面介绍一下:

1.导入数据

登录到系统中,点击“导入数据”开始创建任务。点击进入任务,在“原数据”页面可以看到导入状态,如果数据量很大,自动分词需要一些时间。


2.选出要用的高频词语

筛选词语默认是按词频从大到小排序,把与研究目的相关的词勾上,点击“确定”,这一屏的词就消失了,勾上的词会保存到选词结果里,没有勾上的词就不要了,同时,软件会用勾上的词匹配每条文本,形成一个矩阵,含有某个词,对应的矩阵单元的值就是1。点击词语可以查看样本数据,帮助你快速判断词语的留存。


3. 手工补充词语
有些词语会被切碎,如果没有切出你想要的词语,可以人工添加进去,提交添加的时候,软件也会用添加的词去匹配每条文本。


4.下载数据表
最后下载数据,一次性下载3张表:选词结果、打标结果(标签矩阵)、分词效果;



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2018-3-20 11:48

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 17:48