万能采集

标题: 网址采集---正则采集 [打印本页]

作者: 万能采集    时间: 2018-12-1 16:20
标题: 网址采集---正则采集




上图  我用红线与紫线隔开  大家看的明白一点

前半段的 红线内  和智能采集一样

正则采集  多了  后半段   紫线内   需要写采集规则


下面我们先介绍前半段  红线区  随便进入一个网站





我随便找了一个网站  我们需要进入
第2页 第3页 第4页 第5页  复制他的网址





http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_2.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_3.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_4.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_5.html


我们在变动的地方换成【地址参数】


http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_【地址参数】.html





网址的格式就写好了  







上面是红线区 的网址格式的写法  和智能采集一样   




正则采集多了紫线区  下面 我们需要在紫线区  写采集规则














点击采集  网址的列表就采集出来了









欢迎光临 万能采集 (http://caiji.fxku.cn/) Powered by Discuz! X3.2