万能采集

 找回密码
 立即注册
打印 上一主题 下一主题

[网址采集] 网址采集---正则采集

[复制链接]
跳转到指定楼层
楼主





上图  我用红线与紫线隔开  大家看的明白一点

前半段的 红线内  和智能采集一样

正则采集  多了  后半段   紫线内   需要写采集规则


下面我们先介绍前半段  红线区  随便进入一个网站





我随便找了一个网站  我们需要进入
第2页 第3页 第4页 第5页  复制他的网址





http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_2.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_3.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_4.html
http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_5.html


我们在变动的地方换成【地址参数】


http://www.duwenzhang.com/wenzhang/gaoxiaowenzhang/list_9_【地址参数】.html





网址的格式就写好了  







上面是红线区 的网址格式的写法  和智能采集一样   




正则采集多了紫线区  下面 我们需要在紫线区  写采集规则














点击采集  网址的列表就采集出来了




 

万能采集 - 综合信息
采集规则

规则下载

规则教程

软件下载

万能采集

发布规则

规则下载

规则教程

闲聊闲谈

求助悬赏




万能采集:caiji.fxku.cn

采集网站   浏览器能打开,   万能采集就能采集。

采集app    会使用抓包工具,万能采集就能采集。

万能采集 可实现任何网页app正文提取准确率100%

功能最多,速度最快,任何人都写规则的万能采集软件


回复 百度谷歌雅虎搜狗搜搜360

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|万能采集

GMT+8, 2024-11-24 20:11 , Processed in 0.021613 second(s), 11 queries , Xcache On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表