蓝天采集器免费下载-蓝天采集器规则配置详细教程

蓝天采集器免费下载,蓝天采集器规则配置详细教程

蓝天采集器规则,什么是蓝天采集器?蓝天采集器采用的php+mysql开发可部署在云端服务器,实现电脑端、移动端使用浏览器即可采集数据,,蓝天采集器的规则相对于来说也不是这么简单的。今天给大家分享一款免费万能的采集器,只需要输入关键词就能采集全网文章,或输入域名指定采集网站文章。还支持批量关键词采集(详细参考图片一、二、三、四、五、)万能采集器可对接任何cms系统,免登录实时发布数据。

147发布.png

蓝天采集器的规则介绍:

“规则”支持:(*)(通配符)、正则表达式,使用[内容](通用匹配)或捕获组(正则捕获组)将匹配的数据保存为标签,在“拼接内容”中引用[内容N]标签组成结果

[内容]和捕获组的区别:[内容]会自动转换成固定格式捕获组:(?

而捕获组:(?,可以编写任意正则表达式

[\s\S]*?)

[内容]适用于精准度不高的通用匹配,捕获组适用于精准匹配

147采集设置.png

默认为单个匹配,多个匹配可勾选“允许匹配多个元素”

蓝天采集器的规则分类介绍:

public function param_option_category(){

$catsDb=$this->db()->table('__TERMS__')->select();

$catList=array();

foreach($catsDb as $cat){

$catList[$cat['term_id']]=$cat['name'];

return$catList;

147关键词挖掘.jpg

蓝天采集器的规则配置介绍

//CMS全称必须与你插件的cms程序名一致,$cmsPath为cms的根目录路径

public function cms_db_CMS全称($cmsPath){

//请读取cms的配置文件并将数据库保存为以下数组形式后返回,可参考BaseCms.php中的其它cms_db_方法

$cmsDb=array(

'db_type' => 'mysql',//数据库类型

'db_user' => '',//用户

'db_pwd' => '',//密码

'db_host' => '',//数据库主机

'db_port' => 3306,//端口

'db_name' => '',//数据库名称

'db_charset' => 'utf8',//数据库编码

'db_prefix' => '',//表前缀

return$cmsDb;

147内容处理配图.png

蓝天采集器发布数据介绍

* 导入数据

* 必须以数组形式返回:

* id(必填)表示入库返回的自增id或状态

*target(可选)记录入库的数据位置(发布的网址等)

*desc(可选)记录入库的数据位置附加信息

*error(可选)记录入库失败的错误信息

* 入库的信息可在“已采集数据”中查看

*return array('id'=>0,'target'=>'','desc'=>'','error'=>'');

public function runImport($params){

print_r($params);die();

returnarray('id'=>0,'target'=>'','desc'=>'','error'=>'');

$params数组即参数值列表,打印出来可发现,键名就是参数的变量名,值是最终处理后的结果,直接调用$params[变量名]便可得到参数的值

runImport方法必须返回数组,可以做网址排重、数据记录等作用

应用创建好后可在“后台»云端»已下载»应用程序”中看到,创建的文件则在“根目录/app/标识名”中

注意:应用目录下的index.php为入口文件请勿修改,标识名.php为应用配置文件(建议不要直接修改,而是在“应用»管理»开发应用”中编辑)

应用伪静态配置文件在蓝天采集器根目录:nginx.conf(nginx),.htaccess(apache),web_config(iis)


转载请说明出处
147SEO » 蓝天采集器免费下载-蓝天采集器规则配置详细教程

发表评论

欢迎 访客 发表评论

一个令你着迷的主题!

查看演示 官网购买
×

服务热线

微信客服

微信客服