万能采集 发表于 2018-12-1 16:20:33

网址采集---正则采集





上图我用红线与紫线隔开大家看的明白一点

前半段的 红线内和智能采集一样

正则采集多了后半段   紫线内   需要写采集规则


下面我们先介绍前半段红线区随便进入一个网站





我随便找了一个网站我们需要进入
第2页 第3页 第4页 第5页复制他的网址





http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_2.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_3.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_4.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_5.html


我们在变动的地方换成【地址参数】


http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_【地址参数】.html





网址的格式就写好了







上面是红线区 的网址格式的写法和智能采集一样   




正则采集多了紫线区下面 我们需要在紫线区写采集规则














点击采集网址的列表就采集出来了




页: [1]
查看完整版本: 网址采集---正则采集