蓝天采集器免费下载,蓝天采集器规则配置详细教程
蓝天采集器规则,什么是蓝天采集器?蓝天采集器采用的php+mysql开发可部署在云端服务器,实现电脑端、移动端使用浏览器即可采集数据,,蓝天采集器的规则相对于来说也不是这么简单的。今天给大家分享一款免费万能的采集器,只需要输入关键词就能采集全网文章,或输入域名指定采集网站文章。还支持批量关键词采集(详细参考图片一、二、三、四、五、)万能采集器可对接任何cms系统,免登录实时发布数据。
蓝天采集器的规则介绍:
“规则”支持:(*)(通配符)、正则表达式,使用[内容](通用匹配)或捕获组(正则捕获组)将匹配的数据保存为标签,在“拼接内容”中引用[内容N]标签组成结果
[内容]和捕获组的区别:[内容]会自动转换成固定格式捕获组:(?
而捕获组:(?,可以编写任意正则表达式
[\s\S]*?)
[内容]适用于精准度不高的通用匹配,捕获组适用于精准匹配
默认为单个匹配,多个匹配可勾选“允许匹配多个元素”
蓝天采集器的规则分类介绍:
public function param_option_category(){
$catsDb=$this->db()->table('__TERMS__')->select();
$catList=array();
foreach($catsDb as $cat){
$catList[$cat['term_id']]=$cat['name'];
return$catList;
蓝天采集器的规则配置介绍
//CMS全称必须与你插件的cms程序名一致,$cmsPath为cms的根目录路径
public function cms_db_CMS全称($cmsPath){
//请读取cms的配置文件并将数据库保存为以下数组形式后返回,可参考BaseCms.php中的其它cms_db_方法
$cmsDb=array(
'db_type' => 'mysql',//数据库类型
'db_user' => '',//用户
'db_pwd' => '',//密码
'db_host' => '',//数据库主机
'db_port' => 3306,//端口
'db_name' => '',//数据库名称
'db_charset' => 'utf8',//数据库编码
'db_prefix' => '',//表前缀
return$cmsDb;
蓝天采集器发布数据介绍
* 导入数据
* 必须以数组形式返回:
* id(必填)表示入库返回的自增id或状态
*target(可选)记录入库的数据位置(发布的网址等)
*desc(可选)记录入库的数据位置附加信息
*error(可选)记录入库失败的错误信息
* 入库的信息可在“已采集数据”中查看
*return array('id'=>0,'target'=>'','desc'=>'','error'=>'');
public function runImport($params){
print_r($params);die();
returnarray('id'=>0,'target'=>'','desc'=>'','error'=>'');
$params数组即参数值列表,打印出来可发现,键名就是参数的变量名,值是最终处理后的结果,直接调用$params[变量名]便可得到参数的值
runImport方法必须返回数组,可以做网址排重、数据记录等作用
应用创建好后可在“后台»云端»已下载»应用程序”中看到,创建的文件则在“根目录/app/标识名”中
注意:应用目录下的index.php为入口文件请勿修改,标识名.php为应用配置文件(建议不要直接修改,而是在“应用»管理»开发应用”中编辑)
应用伪静态配置文件在蓝天采集器根目录:nginx.conf(nginx),.htaccess(apache),web_config(iis)
147SEO » 蓝天采集器免费下载-蓝天采集器规则配置详细教程