指定网站采集教程
一、批量分页数网址获取如下图
列表是最常见的网页样式,我们可以通过以下2种方式:
(1) 直接输入列表页详细如下图
(2)通过我们软件生成列表页详细如下图
以下是举例说明:
目标站列表页: http://zb.bbqseo.com/?cate=2&page=2
点击下一页时网址变化为: http://zb.bbqseo.com/?cate=2&page=3
例:http://zb.bbqseo.com/?cate=2&page=[[分页数]] 目标站有多少列表页就生成多少页
由此可以分析得出,page=2中的数字就是分页码,且是每次加1递增。(变化的部分的数字我们用“[[分页数]]”代替)根据目标站具体列表页数生成,需这些网址间有着某种关系,比如等差递增的变化。
二、点选需要采集的字段配置如下图
三、列表页标题获取如下图
四、点选需要采集的内容字段如下图
注:点击空白处,观察内容是否全部包含。(部分网站不规范导致点选内容不全面或标题内容连在一起,可写CSS精准选中)
补充:CSS选择器写法案例教程
五、采集成功如下图