本文为小曹同学在ITSEO上的投稿!支持的可在底部投票!对于转载不注明出处者,我们将投诉,并且在itseo中公布其不道德行为!

 

很多人认为网站的首页排名能力超过分类页。这一点从很多公司做SEO报价,或者自己做站预估排名难度时,以前10名或者前几页有多少网站首页来做参考可以看出来。如果前10名都是网站的首页,他们就判断这个词很难做。

 

这样的想法是没有根据的——一个网站的首页排在另一个网站分类页前面,自然是有原因的——但是没人说过这个原因,这个结论就这样流传开了——也许是某个牛B的大佬在某次牛B的培训上“透露”了这个牛B的经验。不过,一个结论没有根据,就值得怀疑。所以,下面是我的怀疑及分析。

 

抛开剂量谈食物毒性是扯淡的,抛开搜索词谈排名也没有意义。所以先确定一个搜索词“iphone”吧,下面都以百度搜索“iphone”的结果进行分析。

 

百度搜索“iphone”排名:

 

 

这个结果保留了很多开挂的网站,但毕竟只是示例分析,所以就不声讨他们了。

 

15个结果中,网站首页有5个,分类页+专题页有9个,还有1个内容页。结果中有4个网站首页排在后半部分,似乎已经说明了网站首页排名能力并不比分类页强。但现在下这个结论,我也成了经验主义的“肤浅”的人了,所以我会继续分析。对了,在这里推荐下果壳的一篇文章《规律什么的都是骗人的》,目前SEO里面太多的经验主义,太多通过“规律”得出的结论。其实很多所谓的经验都经不起推敲。

 

那么,先从内容开始吧。

排名前列的结果,是搜索引擎认为的,在其收录的页面中,这些页面的内容是和搜索词最相关的。同样的,每一个有排名的页面的内容,也是这个网站中,与搜索词最相关的。

 

似乎有点绕口。这么说吧,排第一的“iphone.tgbus.com”这个页面,是“iphone.tgbus.com”这个网站中和iphone最相关的;排第三的“iphone_百度百科”这个页面,是 “百度百科”中和iphone最相关的。

 

判断内容相关性,有很多算法,tf-idf,余弦相似,最大熵等等,这里就用最简单直观的的tf-idf来判断吧。

 

下面是用55la的关键词密度检测工具和百度site结果估算的TF-IDF

Tf-idf估算结果:

 

 

 

这是个严重估算的结果,严重到很多结果是负的(site结果让人吐血),这还好,最严重的是排名第一的是最小的那个

 

其实算完这15个页面的tf-idf我就后悔了,这样的结果要我怎么分析才能把大家忽悠住嘛 T_T…费了半天时间弄的数据也不能浪费了,硬头皮上吧。

 

如果不管网站的主题和权重,百度经验的专题页面是相关性最好的,应该排在第一的位置,而iphone.tgbus15个结果里最不相关的,应该排在最后——单纯考虑页面相关似乎是这样,那,什么地方出了问题呢?

 

你不会真的以为我会傻到把单个网站页面的tf-idf当作网站之间比较的标准吧?嗯,我还没那么傻。

 

这个道理就像,从普通高中的足球队里挑个最牛B的前锋出来,然后从足球学校里挑个最牛B的前锋出来,这两个前锋在各自学校里的“前锋tf-idf”都是最高的,但是,比赛结果是普通高中的前锋赢了....我们并不能说普通高中的足球比足球学校牛B

 

所以,抛开网站主题谈页面的tf-idf是不公平的。再举个例子吧,一个网站有一万个页面,但只有一个页面提到了iphone,这个页面在网站的iphoneidf是就是4,这个值相当高,但这并不能说明这个页面和iphone很相关,很有竞争力。

 

好,现在比较下这15个网站的tf-idf吧。

 

让我们把整个网络当成一个大的网站,上面15个网站包括iphone的“site结果/网站页面数量”当成“网站关键词密度”,百度site的上限1亿为整个网络的页面数量。

估算下网站的tf-idf

 

 

这次估算的结果我是比较满意的(偷笑ing)。蓝色的区域表示计算网站的关键词密度,网络全部页面为1亿。

 

现在百度经验的tf-idf只有0.25了,而iphone.tgbustf-idf则是16.87,虽然不是最高的,不过,可以说明在iphone这个词上,iphone.tgbus远比百度经验相关(这不是明摆着的事实么,我竟然扯了那么多….嗯,原谅这个开挂的网站吧)

 

所以,这次从内容角度考虑,首页和分类页面在排名能力的PK上,首页胜。不过胜出的原因是首页的内容和搜索词更相关,而不是因为它是首页。

 

再从链接上看看吧。

15名页面链接统计:

 

 

其实这个统计并不能说明链接是如何影响首页、分类页面的排名能力的。毕竟这15个页面都是很不错的页面,不然不会在一个百度指数10000+的搜索词serp中排前15名。

 

好吧,先把你的砖头收起来,我真不是来搞笑的,我哪有能力去分析这15个网站的链接和iphone的相关性呢?我还干点力所能及的事情吧。

 

我们知道搜索引擎有很多链接分析的算法,从最熟悉的PageRank,到各种游走模型;从相关性判断,到垃圾链接分析,林林总总,数不胜数。我们不需要了解那么多的算法,毕竟不是算法工程师,我们只要记住基本的就好了。

 

放在本文的环境下,就是判断相关性链接分析算法的基本原则。

 

一句话概括这个原则就是,对的页面推荐对的页面。额,说这个话题好像有点跑题了,而且猫叔在《什么是“用户或者其他网站的真心推荐”的外链》里说的很明白了,所以还是回到主题,首页和分类页面的排名能力上,嗯,和这15个网站的关系不大了。

 

在链接分析算法里,发出大量链接的页面,和大量链接指向的页面,都有很高的权威性(当然不是垃圾链接啦亲!),被称为链接权威页,内容权威页。

 

一般来说,内容权威页,都是一个网站的内页,讲某个具体话题的。当然百度百科的内容页属于变态,明明一个内容页也导出大量链接(喂喂,百度百科排名好,除了开挂,真的不仅仅是因为html标准用的好)。

 

网站的首页、分类页,则是发出大量的链接指向各个页面,是网站的大枢纽和小枢纽,所以一般首页、分类页排名比内容页好(喂喂,真的不是分类页比内页权重高哇)。

 

那么,作为枢纽的首页和分类页,相互之间的排名能力怎么区分呢?

 

还是前面说的,抛开关键词谈排名是扯淡,抛开关键词谈链接也很扯淡。因为,主题偏移。额,类似主题敏感PageRank吧。

 

一个只谈论iphone的页面,它发出的链接主题是和iphone相关的。这个应该很容易理解,就是和相关网站换链接的原因。

 

但在这个地方,首页和分类页出现了差距。

 

可以看下这15个网站,无论首页还是分类页,都是讨论iphone的(这不是废话么)。其实,我想说的是,为什么威锋网有一个论坛站首页和一个分类页参与了排名,而威锋网首页没有在15名之内呢?

 

从链接上看,就是威锋网的首页主题发生了偏移——以前威锋网确实是首页排名很好,但现在首页关于iphone的主题被稀释了,甚至于低于它的论坛和一个分类页面——这个分类页面的主题和iphone高度相关。

 

威锋网iphone分类排名好过威锋网首页,也说明了首页的排名能力并不比分类页面高。这也是首页和分类页面排名能力产生差距的链接的原因:一个主题分散,一个主题高度集中。

 

内容,链接,两个方面分析完了,基本能算是有根有据吧,至少不是凭规律和经验拍脑袋得出来的结论了。

 

那么,如何运用在SEO呢?

 

用于网站优化,就是相关内容集中,链接主题集中。

 

还是iphone的例子。如果要让某个内容页面排到前15名,那这个页面的内容应该是和iphone相关的,链接上应该成为一个内容权威,变态点也像百度百科一样做成链接权威。这个时候优化的难度就分成了内容难度和链接难度。网站首页?真的和难度没关系呀!

 

做个总结吧。如果说理科生让世界有序发展,文科生让世界更精彩,那么有根有据的理性SEO让网站有序发展,拍脑袋的经验主义SEO则让网站排名很精彩。