本帖最后由 13019480013 于 2016-9-30 18:53 编辑
主题名:淘宝销量
线 索: https://s.taobao.com/search?spm= ... 9f68&sort=sale-desc
同样的页面我有两种需求
第一,我有9000条线索要抓取销量,因为页面是销量排序,所以我要抓取100页里面销量只有5个销量的宝贝是在第几页(抓取指定销量的函数已经学会),如何让软抓取到数据之后,自动进入下一个线索,而不是无脑的反到100页之后再进入下一个线索
第二,我有9000条线索要抓取价格,我只需要抓取前5页所有宝贝价格当中最低价格和最高价格,但是不想要生成5页的数据,在手动的去除,而是一条线索出一个最高价格和最低价格一个XML就可以了
就是说尽量一条数据生成一个XML
|
|
|
|
|
共 1 个关于本帖的回复 最后回复于 2016-9-30 23:23