夜息:TF-IDF(词频-逆文档频率)与关键词排
今天看到zero发的关于TF-IDF的关键词排名问题 http://semwatch.org/2012/03/tf-idf/
想到自己在N久前写过一篇未发表的草稿,里面提了提做SEO需要 “理解tf-idf的原理”。只是当时没写完,也没发出来。
其实TF-IDF可以解决很多SEO的基础问题。
例如,拿京东商城为例,关于京东商城我观察了很久。从去年开始京东的SEO开始发力,制作了/series/频道。之后改版过几次。
(不幸打不开京东网页,没法截图做例子,这个series频道猜测应该是学的zol)
series作为一个主题页面系列,从刚开始单页面,后来在某次改版后分拆成了多个页面。
例如,原来有一个主题页面,叫做 “飞利浦F073剃须刀”
改版成变成了
飞利浦F073剃须刀 图片
飞利浦F073剃须刀 评论
飞利浦F073剃须刀 问答
飞利浦F073剃须刀 XX
等N个页面。
意图很明显,想要获取大量的产品+附加词的长尾流量。
但是事实上,类似“飞利浦F073剃须刀 图片”这样的关键词,想用一个如此深层页面获取的排名的可能性非常低,此类“长尾”页面获取的链接资源仅仅是一个主题页上获取。分拆如此多的页面,还非常容易出现空白内容的页面,对搜索引擎不是一个好的体验。
通过TF-IDF原理,”飞利浦F073剃须刀 图片”这样的词,仅仅需要关注“飞利浦F073剃须刀”这个词的排名即可,“图片”这个词的IDF值实在是太低了。仅仅需要在title上匹配一下,可能就能出排名,甚至只需要在页面上出现一下,就可以了。
之前说,这个频道应该是学的zol,zol也做了分拆,但是zol解决了上面的部分SEO问题
1.它拥有大量的内容,哪怕图片,测评都是很满的页面,一定程度上避免了空白页面
2.zol的外链策略导致它的series页面的主词权重非常高(有兴趣可以去研究下),其导出链接质量也很不错。
没有解决的问题是,大量类似主题的页面导致内部竞争,权重还是不够聚集,需要大量的外部资源。
这类大网站有着丰富的资源,可以去这么做。因为zol完全是靠流量吃饭的站,SEO可以作为运营的主力。而一些中型网站,电商网站,SEO未必会是企业内资源最多的部门。这么随意模仿大型网站的做法,是会出问题的。
还是引用下百度的官方推荐
“SEO可以帮你将网站中的高质量内容更好的呈现给搜索引擎,获取更多流量”
SEO的前提是你网站中有高质量的内容,而不是一味得去呈现。
文章来源:夜息博客 http://www.imyexi.com/?p=517
夜息系列文章:
转载请注明: 爱推站 » 夜息:TF-IDF(词频-逆文档频率)与关键词排
评论列表(0)
发表评论