文章采集过滤不相关文章的教程
快捷导读:
一、打开词库
二、添加敏感词
三、调用词库
四、总结
很多网友提出,在采集的时候会采集到一些不相关的文章,这是因为大家没有设置敏感词库,在设置了敏感词库后就可以大大避免采集到不相关的文章,下面就是采集工具,过滤不相关文章的教程:
在采集首页,找到窗口右上方的【词库配置】,弹出词库界面,然后在词库界面点击右上角的【新增词库】。
如下图所示,在新增词库界面选中【敏感词】,然后在下方的方框内输入用户不像采集的敏感词,多个敏感词的话,只需要跳行输入即可,设置好后点击上方的保存就可以了。
回到采集任务界面,按照下图所示,点击1号箭头所指的【设置】弹出2号箭头所指的词库调用界面,在此界面选到刚刚设置好的词库就可以了。
通过增加敏感词的方式确实能大大过滤采集时的不相关文章,但是根据用户自己需求,敏感字还需要用户多多挖掘和发现。
转载请说明出处
147SEO » 文章采集过滤不相关的文章教程
147SEO » 文章采集过滤不相关的文章教程