蜂集添加自动采集任务
蜂集采集器是一款全自动的采集器,本文将介绍蜂集采集器添加自动任务。如果没有安装蜂集采集器,可以前往蜂集采集器下载页面进行下载。
在添加任务之前,推荐阅读添加采集模块教程,因为添加任务需要绑定一个采集模块。
进入蜂集->任务列表,点击添加任务按钮,将会出现添加任务表单。
一个最简单的任务可以只填写基本信息,需要填写的信息有任务名称,入口url。需要设定的信息有采集模块,发布模块以及文章发布状态。
设定 | 作用 |
任务名称 | 为任务设置一个名字 |
入口URL | 采集插件抓取的第一个网页,也就是采集入口 |
采集模块 | 这个任务都会使用这里绑定的采集模块去采集 |
发布模块 | 这个任务都会使用这里绑定的发布模块去发布 |
文章发布状态 | 设置这个任务下的文章发布时候的发布状态 |
添加任务完成之后,我们就可以返回任务列表,首先手动执行一次,看看任务是不是能够正常跑起来。
如果能够正常跑起来,那么可以直接点击右侧的开始。
这样,一个全自动运行的任务就在后台运行了。
你可能还喜欢下面这些文章
imwprobot(蜂集)是一款功能强大的全自动智能采集插件,专为WordPress设计。它能在服务端自动运行,无需人工监督或额外的电脑环境。主要特点包括全自动无人值守定时采集、自动同步目标站更新、AI自动生成关键词和摘要等。蜂集支持多种站点
如下图:现在我们可以建立一个简单的采集任务,我们现在可以采集一个新闻网站。现在可以添加任务,采集模块和发布模块选择我们刚才建立的模块,如下图:填写完毕之后,点击提交即可。
在新建发布模块的时候,可以看到左侧有标题、正文、分类目录等信息,这个时候将采集的字段填写到右侧的内容框即可。在没有新增自定义的采集字段的时候都可以使用默认发布模块,默认发布模块只保证标题,正文有值即可发布。
测试采集当所有的规则都编写完毕之后,我们需要验证一下采集器是不是可以根据该规则正确采集,进入测试抓取Tab,填写链接和页面层级,点击抓取测试,查看效果,如下图:如果对采集器有使用上的疑惑,可以到蜂集采集交流群(群号在采集器的关于我们中可以找到
wordpress本身并没有采集功能,不过可以通过插件来实现采集功能,目前wordpress上比较好的采集插件是imwprobot(蜂集采集),可以实现全自动采集,虚拟主机也可以运行。
采集器的运行模式有两种:用户触发和定时任务(进入蜂集-系统配置-系统设置即可看到运行模式)。定时任务如果您安装了主机面板,设置定时任务十分方便,那么我们更推荐您使用定时任务模式。
上面xxx一般是发布字段,后面的一串以大括号包住的内容则是条件,min_len表示该字段里面的内容最小长度,比如设置1表示采集到的长度大于1才会入库,否则就会提示发布条件不通过。
spm=a2oq0.12575281.0.0.4ace1debEFUDXU&ft=t&id=618722676249收费标准时长原价优惠价折扣1个月9.99.9无1年118.899.08折2年237.9179.07.5折3年3