SEO实验的可行性

昨天谈到统计数字在SEO中的局限,其实这牵扯到另外一个问题,也就是SEO实验的可行性和可信度。

无数的人都在试图通过实验来解读搜索引擎算法。这有个专门的词,逆向工程,reverse engineering,也就是在可控条件下,改变网页某些参数,然后观察搜索排名变化,试图分析出搜索引擎排名算法。

这些逆向工程和SEO实验,很多高手和大公司都在不停的做着,有的也很有成果。可是说到底,这种实验数据是不能百分之百可靠的。

这就像解数学题:AxB=C。当我们知道结果C(也就是搜索引擎排名)和A或B中一个数据时,我们能计算出A或B中另外一个数。但是当我们对A和B中两个数都不知道时,只能列出一堆可能性,却不可能得到唯一的AB数值答案。

更何况搜索引擎算法考虑的不是两个数值,而是一两百个参数。而我们这些外人对这一两百个参数能确切知道的没几个。所以想通过反向工程推论出这些参数是怎么设置的?在排名算法中占有的比重?理论上是不可能的。

举个简单例子,假设我们想实验关键词密度是3%好还是5%好。一个可以设想的实验模型是,用两个同时注册的域名,放上相同长度的文章内容,其中一个目标关键词密度3%,另一个密度5%,在同一个网页上放上这两个新域名的链接。等收录后查询目标关键词,看哪个网页排的靠前。这关键词的选择最好是很冷门生僻的词,甚至是唯一的词,在其他网页上没出现过。

可是这样一个看似还算合理的模型,却忽略了很多可能影响试验结果的因素。比如,同一个网页上放两个链接,必然有前有后,这两个链接的权重会不会不同?新域名收录时间会不会造成不同?而收录时间又会不会造成域名权重不同及排名不同?

一旦网页上出现这两个域名的链接,怎么保证没有其他人,其他任何地方出现这两个域名的链接?因为一旦出现,实验者就不能保证这两个域名的链接数目和权重完全一样。

另外,这两个新域名网页内容要不要是一样的内容?还是不同的内容?如果是一样,或者是大部分一样的内容,是不是会造成复制内容网页?而对复制内容,搜索引擎将选择其一为原创,另外一个为复制。在其他条件完全相同时,这个选择是不是是随机的?如果内容放不一样,由语义分析带来的微妙差别怎样计算?

这种种因素其实都很难控制,会对实验结果造成什么影响很难讲。严格来说,要在完全受控条件下进行SEO实验,是我们这些做网站的人办不到的。SEO实验结果有时有很高的参考意义,有时也很误导。

------首次发布日期: 2008年03月14日

作者: Zac
版权属于: SEO每天一贴
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。



42 条评论 “SEO实验的可行性

  1. 分析的很透彻,行文流畅,通俗易懂(我非常喜欢这点)

    前几天看了《搜索引擎原理、实践与应用》,感觉对理解SEO很有帮助。不知道我们从做“搜索引擎”的角度做“SEO”如何?

  2. 早上一来看到右边的调查,吓我一跳,还以为ZAC要开始对这里进行收费了(哈哈,当然ZAC不可能那么小气的)!
    后面的话又让我的心放下来来了.
    轻声的说一下,如果二元人民币我还是可以接受的,五元人民币没想过(一月里,我少做一次公交,算是加强身体煅炼)!

  3. 国内的免费观念太深入人心了;
    恐怕一时也难以改变。
    ZAC如果真搞付费订阅了,估计要失去绝大部分的用户,虽然我愿意付费订阅。

  4. 搜索引擎的一切算法和算法改进都是为了用户,为了准确查询和合理的排名。
    毕竟搜索引擎用户才是他们的衣食父母和存在的意义。

  5. 我的感觉是,SEO实验很容易弄成那个著名的生物学实验:
    把苍蝇的腿砍掉,然后对苍蝇喊叫,苍蝇没有爬开,所以腿是苍蝇的听觉器官

  6. 不断的实验,爱迪生试验了1600多种材料。一次次的试验,一次次的失败,很多专家都认为电灯的前途黯淡。英国一些著名专家甚至讥讽爱迪生的研究是“毫无意义的”。 …

  7. w我觉得目前最好的收费就是浏览者在阅读完ZAC的每一篇博客后认真的留读后感和对文章的一些见解就是最好的收费。就像我一样,要不就不来看连访问量都不给一个,要不来看了,就理应留下点什么。(因为段时间自己的免费论坛被封了,问爷爷借钱后才租的空间,穷啊)。以后我也会有个人独立门户博客的。以后就不用再链接里留下网站的链接了。无奈啊

留个言呗:

您的邮箱不会被显示在页面上。标有*的是必填项。