2023年12月第四周更新:图片本地化、蜂集采集器
图片本地化插件更新
图片本地化插件增加了压缩和优化功能,如下图:
自动保存的外部图片的时候,可以自动压缩图片。
这个功能很实用,测试体积可减少50%左右,图片质量却没有太大变化。强烈推荐大家启用!
另一个是增加了定时任务接口。有朋友反馈说本地化图片太慢,浏览器一直开着也不是办法,希望我增加一个定时任务。
想了想,可以直接把接口暴露出来,用定时任务访问即可。
蜂集采集器插件更新
蜂集采集器本周更新了两个功能:
- 列表规则支持XPath
- 手动添加链接支持2个通配符的笛卡尔积(我也不知道怎么描述这个功能了,总之牛!)
增加XPath规则
xpath主要用来采集XML内容的。比如RSS采集我们一般用XPath去抓他的列表链接。
像抓取微信公众号,一般可以用抓取rss的方式来采集。
手动添加链接更新
现在填写的输入支持两个占位符(或者叫模板变量),分别是{1}和{2} (原先是用*号)。通过占位符我们可以组合出很多链接。
生成的链接列表如下:
这歌功能应该是相当实用的。
大家可以在官网下载这两个插件,如果安装了可以直接在wordpress后台更新。
蜂集采集器直达链接
imwprobot(蜂集)是一款功能强大的全自动智能采集插件,专为WordPress设计。它能在服务端自动运行,无需人工监督或额外的电脑环境。主要特点包括全自动无人值守定时采集、自动同步目标站更新、AI自动生成关键词和摘
图片本地化直达链接
使用wpasi非常简单,只需要在WordPress后台安装并启用插件,发布文章时会自动将文章内的所有图片本地化。插件支持一键本地化历史文章,如下图:该插件可以配合自动发文插件一起使用,文章自动发布时,图片就可以自动本地化
你可能还喜欢下面这些文章
2、自动生成的图片并非真实在磁盘中的图片,而是动态生成的,如果保存到磁盘会占用大量空间,这个空间没必要浪费,因此修改主题代码,直接将缩略图的地址改为wpac自动生成的缩略图地址是一个非常好的方案。
使用wpasi非常简单,只需要在WordPress后台安装并启用插件,发布文章时会自动将文章内的所有图片本地化。插件支持一键本地化历史文章,如下图:该插件可以配合自动发文插件一起使用,文章自动发布时,图片就可以自动本地化。
什么是内链内链,顾名思义就是在同一网站域名下的内容页面之间的互相链接(自己网站的内容链接到自己网站的内部页面,也称之为站内链接)。自动内链工作原理简单来说,我们设定一些词表以及词表对应的链接,比如词是wordpress插件,链接是http。
首先我们需要找到分页链接和其他链接不一样的地方,例子中的分页的链接都有“page”这个单词而其他的链接都没有这个单词,那么我们在列表规则中的链接包含框填上“page”,这样就可以采集到所有的翻页链接,如下图:填写完了之后,我们将测试的链接填入
比如我们使用首页测试一下抓取,可以看到下面抓取了很多链接我们再用内部文章页面测试抓取,可以看到下面依然有新的链接第二步:设置正文规则如果你懂XPath或者正则,那么写一个抓取正文的规则是一件很容易的事情。
请查看更详细的设置教程:wordpress如何设置固定链接。登录wordpress后台,点击后台设置栏目下的“固定链接”按钮。wordpress提供了6种链接形式供我们选择。
在本章中,我们将学习在WordPress页面中添加链接。以下是在WordPress中添加链接的简单步骤。在WordPress中创建的页面列表将显示如下所示的屏幕。在这里,我们将在关于我们页面中添加链接。
测试采集当所有的规则都编写完毕之后,我们需要验证一下采集器是不是可以根据该规则正确采集,进入测试抓取Tab,填写链接和页面层级,点击抓取测试,查看效果,如下图:如果对采集器有使用上的疑惑,可以到蜂集采集交流群(群号在采集器的关于我们中可以找到