干掉百度飓风算法的方法
最近百度推出飓风算法,严厉打击恶劣采集站,很多站点不幸中招,流量一夜回到解放前。我研究了百度和Google的文档,详细定位了算法的命中范围。百度公告我们先来看下百度官方公告,内容如下:
最近,百度推出了飓风算法,严厉打击不良收集站。不幸的是,很多地方被招募,交通一夜之间就恢复了解放。我研究了百度和Google的文档,详细定位了算法的命中范围。
百度公告
我们先来看下百度官方公告,内容如下:
很明显,飓风算法2.0在飓风算法原有基础升级了很多,原有飓风算法旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。
飓风算法将定期生成惩罚数据,并随时根据情况调整迭代次数,这反映了百度对糟糕收集的零容忍。如果质量原始网站发现网站索引显著减少,流量显著下降,反馈可以在反馈中心进行。
飓风算法分析
根据官方文件,飓风算法的目标是网站,而不是网页;它主要针对的是收集不良的网站,而不是所有内容不良的网站。
哪些内容算是恶劣采集
不好的内容收集通常是指不需要花费时间、精力、专业能力、手动集成或对用户没有附加值的内容。
本节有以下类型:
从其他站点采集的内容。收集整个页面内容,收集主题内容,或者将多个内容编译在一起。这种类型的内容很容易识别。
采集之后轻度加工的内容。它包括修改一些单词,修改一些句子,或者使用单词批量替换的形式(部分伪原始工具)。这种类型的承认有点困难。
为什么有些网站也是采集的,但没有受到影响,比如360doc、某浪。事实上,只要你做了某一点,它就是一个不错的集合,这一点就是:为用户带来附加值。
附加值包括站点增益和内容增益。此时,你可以引用百度搜索技术博客中的一段“简单地谈谈互联网页面的价值”:
有人发了一篇关于新闻事件的原创博客,随后被新浪转载到新闻频道。也可能有与其他相关事件的新闻连结。这些可以称为内容增益。因此,即使主题内容没有变化,新浪的转载也很有价值,而且它的稀缺性也很高。
同样,反过来说,如果转载的网站相当不知名,则其无法带来站点名/稳定性/速度的增益。KKU国内免费分类 综上所述,对于主体内容重复的页面,我们应该评价其是否存在站点增益和内容增益,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。
这里的要点是:页面价值、增益
因此,只要能给用户带来网站增益、内容增益和附加值,就可以看出网页有其独特的价值,不会受到飓风算法的影响。
转载请注明: 爱推站 » 干掉百度飓风算法的方法
评论列表(0)
发表评论