这个自动登录怎么弄啊 ?


举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2016-10-27 18:15

沙发
ym 版主 发表于 2016-10-27 18:04:23 | 只看该作者
可以先在浏览器上登录好,爬虫采集就会同步到登录状态。
配置自动登录有些麻烦,要自己写xpath。
具体操作都可以参考下图红框里的文章

举报 使用道具
板凳
Kernel_Debug 初级会员 发表于 2016-10-27 18:08:26 | 只看该作者
ym 发表于 2016-10-27 18:04
可以先在浏览器上登录好,爬虫采集就会同步到登录状态。
配置自动登录有些麻烦,要自己写xpath。
具体操作 ...

这里看了,他说的配置文件,关键这个配置文件怎么用啊,放那里啊?我有100多个网站,因为网站多,不可能一个个运行,想放在服务器自动运行,自动登录这里没有登录接口 ,要怎么设置呀。

举报 使用道具
地板
ym 版主 发表于 2016-10-27 18:12:26 | 只看该作者
配置文件里提到的参数与个人中心的自动登录里的参数,都是一样的参数。
默认是规则所采集网站的登录页,所以不用写登录网址,只需对网站的登录页写xpath就行。
举报 使用道具
5#
Kernel_Debug 初级会员 发表于 2016-10-27 18:13:35 | 只看该作者
就是系统提示登录 自动跳入到登录页面 你们这样 判断的吗
举报 使用道具
6#
ym 版主 发表于 2016-10-27 18:14:00 | 只看该作者
是,所以直接对登录页写xpath就行
举报 使用道具
7#
Kernel_Debug 初级会员 发表于 2016-10-27 18:14:49 | 只看该作者
有个登录成功标识 有点不明白 我的登录是ajax登录  返回  {"redirect_url":"\/welcome","login_status":"success","error_message_title":"invalid login","error_message_content":"","password_expired":null}

这个得怎么写xpath
举报 使用道具
8#
ym 版主 发表于 2016-10-27 18:15:12 | 只看该作者
不用抓包分析,网页上需要在哪里填什么,直接写xpath就行了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 06:02