指定网站滚动采集教程
快捷导读:
随着移动互联网的到来,滚动加载更容易给予用户无缝阅览体验,因此容易沉浸其中,替代了传统意义上的“下一页”数据加载,下面就给大家介绍一下滚动采集的配置方法。
我们软件针对不同的网站展现类型,都有对应的采集方式,传统的“下一页”我们选择列表类型,这次的目标站是滚动加载数据所以我们选择【滚动页面类型】。
我们只需要在分页设置里填入我们需要采集的链接,软件将自动向下滚动加载出更多的新数据便于我们采集。
根据自身的需求去点选我们需要采集的字段,也可以随时对这些字段进行修改、删除!
当我们点击列表页标题后,软件会自动识别该网页下的所有标题,我们只需要点击预览并设置内容进入下一个界面采集需要的数据(注:未识别网页下的所有标题,我们可用CSS选中器来识别网页下的所有列表标题)
参考资料【CSS选择器写法案例教程】
只需要点选我们设置的字段即可,点击【已选标签】可再次点选对应的数据。点选内容时我们需观察观察内容是否全部包含,未全部包含时尽量点击空白处让所有的段落包含其中(注:部分网页不规范导致点选内容不全面或标题内容连在一起,我们可用CSS选择器精准识别网页中的标题和内容)
参考资料【CSS选择器写法案例教程】
保存好后我们将会进入批量采集管理任务界面,找到配置好的任务点击开始采集,我们也可以实时预览采集的内容。
转载请说明出处
147SEO » 指定网站滚动采集教程
147SEO » 指定网站滚动采集教程