万能采集

 找回密码
 立即注册

[网址采集] 网址采集---正则采集

[复制链接]
万能采集 发表于 2018-12-1 16:20:33 | 显示全部楼层 |阅读模式

QQ图片20181201160235.png

QQ图片20181201160603.png

上图  我用红线与紫线隔开  大家看的明白一点

前半段的 红线内  和智能采集一样

正则采集  多了  后半段   紫线内   需要写采集规则


下面我们先介绍前半段  红线区  随便进入一个网站


QQ图片20181201160936.png


我随便找了一个网站  我们需要进入
第2页 第3页 第4页 第5页  复制他的网址
QQ图片20181201161135.png


QQ图片20181201161236.png

http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_2.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_3.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_4.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_5.html


我们在变动的地方换成【地址参数】


http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_【地址参数】.html


QQ图片20181201161415.png


网址的格式就写好了  


QQ图片20181201161516.png

QQ图片20181201161607.png


上面是红线区 的网址格式的写法  和智能采集一样   




正则采集多了紫线区  下面 我们需要在紫线区  写采集规则

QQ图片20181201161659.png



QQ图片20181201162323.png

QQ图片20181201163002.png


QQ图片20181201163352.png

QQ图片20181201163455.png

点击采集  网址的列表就采集出来了

QQ图片20181201163635.png


回复 百度谷歌雅虎搜狗搜搜360

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|万能采集

GMT+8, 2025-2-11 06:10 , Processed in 0.026811 second(s), 11 queries , Xcache On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表