网址采集---正则采集
上图我用红线与紫线隔开大家看的明白一点
前半段的 红线内和智能采集一样
正则采集多了后半段 紫线内 需要写采集规则
下面我们先介绍前半段红线区随便进入一个网站
我随便找了一个网站我们需要进入
第2页 第3页 第4页 第5页复制他的网址
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_2.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_3.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_4.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_5.html
我们在变动的地方换成【地址参数】
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_【地址参数】.html
网址的格式就写好了
上面是红线区 的网址格式的写法和智能采集一样
正则采集多了紫线区下面 我们需要在紫线区写采集规则
点击采集网址的列表就采集出来了
页:
[1]