相关文章推荐插件wprec中的高频词是什么意思?
在WordPress相关推荐3.x版本中增加了高频词统计功能。一起来看看这个神奇的功能有什么用!
wprec利用相似度算法计算每篇文章之间的相似度,找到与当前文章最相似的一些文章,展现在文章底部作为相关文章。我们知道,相关推荐插件推荐的原理是根据当前文章的特征(文章的高权重标签),从文章库中召回相关文章,再根据相关性
什么是高频词
大家知道,相关推荐wprec的主要功能是根据当前文章相关度推荐前N篇文章展示在文章底部。
而在推荐的流程中,第一个步骤就是是根据文章的特征词召回一批文章。只有把相关的文章召回了,才能进行下一步的相关性计算!
比如一篇文章的特征词是:WordPress、插件、推荐、核心、相似、相关、排名、调权、SEO、展示、分类、分词。(是不是觉得这些特征词就是wprec的介绍页面的特征词?)
推荐插件会根据这些特征词去召回相关的文章。但我的网站上,几乎每篇文章都有WordPress这个特征词。因此召回的时候,会召回所有的文章。这样不仅消耗性能,而且还会影响相关性计算。
我们需要的是真正相关的文章,所以应该在召回阶段就尽可能排除干扰因素。避免召回过多不相关的文章以及加入不相关的特征词进行计算。
当WordPress出现在所有文章里面的时候,WordPress这个词就成了一个高频词。甚至只要网站10%的文章出现的词,都可以叫高频词。阈值需要根据自身网站内容的垂直度决定。
这样的词作为特征是没有意义的。就好比我们要找一个人,仅靠黑色头发去识别是没用的一样。因此我们需要在分词的时候去掉!
高频词功能怎么用?
在相关推荐的后台设置中,点击高频词统计。设置好词频率(比如10表示出现频率大于10%的词)。
设置词频之后需要保存一次,然后刷新页面再统计高频词。不然统计的结果还是上一次的词频设置。
在相关推荐的后台设置中,点击高频词统计。设置好词频率。比如10(表示出现频率大于10%的词),点击开始统计即可。
统计的结果就是你需要的高频词,这种高频词不仅会增加召回压力,还是影响计算。
因此,我们可以把统计出的词设置为分词黑名单。具体做法是在分词设置中增加,每行一个词。
加入黑名单之后。需要开启强制更新,这样刷新的时候无论有无分词,都会再重新分词。
记得开启强制更新后,保存一次设置,不然设置不生效)然后点击重置进度,再点击刷新数据,即可刷新所有文章的分词。
去掉高频词后,推荐精准度将会大大提升,效果会更好,同时推荐性能也会增加!强烈推荐大家使用高频词功能!大家可以观察本文的相关推荐区域内容,肉眼可见基本是相关性很高的文章
如果您还不知道什么是相关推荐插件,那么点击下方文章卡片去了解这个能提升搜索排名和页面质量的插件吧!
wprec利用相似度算法计算每篇文章之间的相似度,找到与当前文章最相似的一些文章,展现在文章底部作为相关文章。我们知道,相关推荐插件推荐的原理是根据当前文章的特征(文章的高权重标签),从文章库中召回相关文章,再根据相关性
你可能还喜欢下面这些文章
wprec利用相似度算法计算每篇文章之间的相似度,找到与当前文章最相似的一些文章,展现在文章底部作为相关文章。我们知道,相关推荐插件推荐的原理是根据当前文章的特征(文章的高权重标签),从文章库中召回相关文章,再根据相关性评分,最后选出TopN
自动聚合任务插件可支持在后台自动聚合,支持设置任务间隔、发布状态、发布分类等参数插件下载购买授权使用说明第一步:导入素材第二步:优化索引第三步:导入标题第四步:设置聚合规则第五步:设置发布规则第六步:开始聚合。
除了手动添加还可以导入关键词,一行一个即可关键词导入界面还可以设置每一篇文章的最多标签数量,如下图:。STEP2、接下来你需要丰富关键词库,可以选择手动添加关键词或者导入关键词。
使用教程在核心文章管理中,点击添加文章,即可将普通文章变成一篇核心文章。您可以在这里直接修改文章属性,改成核心文章或者取消核心文章,如下图:这款插件单独使用您只能看核心文章,威力可能并不是那么大。
很久之前开发过一个文章去重插件,由于需要生成文章指纹,而生成指纹又依赖分词。因此2.0版本移除api分词,使用一个简单的本地分词器分词。这次改为本地分词,因此这个功能也可以加上了。
wprec是WordPress上一款真正意义上的相关推荐插件,推荐真正和当前文章相关的文章。提升页面排名和用户体验。 修复了摘要里面显示短代码,提升用户体验v2.7v2.1。
这个方案成本太低了,任意一个文章站都能变成付费下载站。最近我也准备出一个这种付费下载文档插件,帮助大家提升网站的盈利能力,敬请期待。他的内容有一个特点,就是每篇文章都是通过几篇短文章合并而成,文章很长。
摘要:该文章介绍了一款新开发的WordPress插件,旨在提高文章推荐效率和原创性。该插件采用分词技术生成相关词信息,并在文章中随机插入相关词推荐,提高文章的可读性和搜索引擎质量评分。开发过程中考虑了传统标签方法的不足,并采用新策略优化推荐系