关于SEO技术规范的一些说明

通常博客帖子的留言比较泛泛而谈,没那么具体,也比较少需要回复。上星期的帖子《技术部门SEO规范》则有不少对其中一些技术点很具体的疑问,所以写个帖子回复一下。

作为SEO技术规范,只是列出了应该做什么和不应该做什么,没有解释原因,所以确实会使有些读者不明所以。有的地方是个人偏好,或者有不同解决方法,只是选择其一,不一定要按我写的规范这样处理。重要的是,选择一种处理方法,就要保持一致性,各个地方都要遵循同样原则,所有技术人员都要用同样方法,不要各行其是,结果出现矛盾的处理方法。

SEO技术规范问题解答

静静的民心河问:

Zac老师做了这么详细的规范,这些一般都适用于大公司的大型网站吧?
一些小公司的感觉很多都实现不了呀!
小公司的网站,有什么更好的规范建议吗?

答:

和网站大小没关系,规范是一样的。其中并没有什么小公司不能实现的,实际上,小公司没那么多层级、条条框框,更容易实现。技术上,真没有什么什么能称得上是技术的东西,都是最基本的。

乐梵问:

栏目页面翻页Title缺省格式:二级栏目名称 – 一级栏目名称 – 网站名称 – 第X页

不应该为

栏目页面翻页Title缺省格式:二级栏目名称 – 第X页 – 一级栏目名称 – 网站名称

么?

答:

都行。title太长的话,去掉一级栏目名称也可。重要的是带上页码,使标题有所区别,让用户和搜索引擎都知道自己在哪。

Betty问:

「站内搜索结果页面使用robots文件禁止搜索引擎抓取。」
请教这是为什么呢?是防止重复内容吗?那种文章列表翻页页面好像差不多呀,为什么就可以呢
我自己上网时候经常会搜到这种结果页面,感觉还蛮能带来流量的

答:

搜索引擎并不喜欢收录站内搜索结果页面。原因很多,比如你说的重复内容问题。还有用户体验问题,搜索引擎希望把用户直接带到最终回答查询的页面,而不是另一个搜索引擎页面。还有内容质量问题,一些搜索结果页面根本就是空的,没有符合条件的搜索结果。

另外,如另一位读者sindy回答的,有时候搜索结果页面会被黑帽利用,搜索一些敏感关键词,让搜索引擎收录结果页面,或者做自己的广告,或者陷害竞争对手等等。具体例子可以看以前的百度处理垃圾外链问题帖子

文章列表是网站必须的内部结构,没有列表,用户和搜索引擎都无法访问最终页面。形式差不多,实质是不同的。

你在网上搜到的这种结果页面,通常是以聚合或tag页面显示展现的,实质确实就是搜索结果页面。但这种页面的使用首先要有海量内容为基础,词库的选择、搜索结果质量的控制等都是要谨慎计划、监控和调整的。所以,不是不能用,是技术部门不能没有和SEO部门商议就随意使用,或者说,缺省设置是,先别用,和SEO部门商议出好的方案,再用。

Cici问:

栏目页面翻页Title缺省格式:二级栏目名称 – 一级栏目名称 – 网站名称 – 第X页
翻页格式不太了解是什么意思呢?
其次,关于页面title是否要与这个产品页面的名称一致问过几个老师,有的说最好不一致,有的说一定要一致。我看到Zac说产品页面title就是产品名称 – 网站名称,是否意味着,页面title也要与产品名称保持一致?

答:

翻页指的是,每个栏目,比如显示20篇文章,栏目下多于20篇,页面下边肯定要有下一页、第二页、第三页之类的链接,那些页面就是翻页。从第二页开始,翻页页面的标题要带上页码。

不一定一致。所以系统要有人工改写title的功能。但缺省的设置通常是title就是产品名称,这个最容易实现,后期再挑重要页面人工改写。

梦站博客问:

URL结尾以html结尾和非html结尾有什么区别么?搜索引擎对结尾有什么要求么?

答:

没区别,搜索引擎也没有要求或偏好。之所以建议目录以斜杠 / 结尾,产品、文章以html结尾(或者php结尾,或者htm,都一样),只是让自己和用户一看URL就知道这是个目录还是产品页面。有的网站和CMS系统产品/文章页面也是以斜杠结尾的,对搜索引擎没什么区别。

robin.wong问:

“中文网站,产品/文章页面文件名使用数字/字母编号” 比较疑惑:您自己的此页面的url命名没用数字或者字母啊?

答:

是的,因为我的WordPress设置选择的是自定义帖子URL,对我来说,以几个英文单词作为帖子URL比较省事。对不习惯写英文单词的人来说,完全可以选择帖子编号。对大部分新闻、电商网站来说,内容量大,人工写URL就比较不现实了,大批量实现还是编号最直接。

麦小超问:

关于中文页面文章URL, 对于 英文单词、中文拼音、数字或字母,首选排序应该如何,比如关键词是 红木家具 :1./hong-mu-jia-ju.html ; 2./redwood-furniture.html; 3./12346.html
ZAC 老师您认为对于百度来说,哪种情况是最优的?

答:

对百度来说没区别。对你自己和用户来说就有区别了。你产品少、有足够人力写redwood-furniture.html的话,那挺好,要是几十万产品,恐怕编辑要疯。hong-mu-jia-ju.html这种,用户真的有时间去读汉语拼音吗?还有的网站写成hongmujiaju.html,那编辑和用户可能都要疯。

Lisa问:

Zac老师,文中您提到的
“除非SEO部门另行要求,页面不使用Keywords标签。”
是什么意思呢? 我了解的 Keywords标签的作用虽然大不如从前,但是我们也会加上这个标签的,能否解释一下?

答:

不是作用大不如前,是完全没有作用。所以多一事不如少一事。

winloong问:

响应式,为啥不是独立的移动站。独立的移动站不是更好吗?

答:

独立的移动站并没有更好。未来趋势是响应式设计,维护更简单。以前使用独立移动站是因为带宽、手机速度等限制,移动版必须简化,现在已经不是问题。现在Google已经全面转向移动优先索引,从百度对移动搜索的重视看,也是早晚的事,完全没有必要做一个比PC版简化的移动站了。

更新:读者Leo就这个问题留言很有意义,读者们可以了解更多开发、资源等角度的考虑。搬到正文中供大家参考。谢谢Leo:

移动站点开发现在主流的方式有三种:独立域名、客户端响应式、同域名下服务端返回不同内容(RESS)。

独立域名方案的前后端架构成本都不高,但是一件事情做两遍,开发成本翻倍。另外SEO方面需要了解canonical元信息。

响应式是一个后端架构成本低,前端架构成本很高的方案。一套前端代码要适配各种桌面显示器、横竖屏平板、横竖屏手机,方案维护成本非常高,不易变更。开发方面的成本有所降低,但有限。内容精简在前端实现,更多是视觉上的,移动端流量浪费的问题在国内还是需要关注,国内的4G没有宣传的那么快,至少图片响应式必须做。如果要考虑视障人群(国内部分大厂已经很关注这块了,包括我厂),兼容voiceover的体验,前端的架构成本会更高,开发规范也必须严格执行。

RESS,在后端就对用户进行一定的区分,对不同的设备返回不同的内容,以降低前端响应式的成本。这个方案相当于把上面两个方案揉到一起,取长补短。前后端都有架构成本,但相对比较容易接受。SEO方面需要了解HTTP Vary头。开发方面也有额外的成本。

开发和SEO一样,做80分的成本并不是做100分的80%,实际可能只有50%,甚至20%。所以选型到底怎么选,很多时候要考虑手里技术资源的实际情况。堆人可以解决的开发成本,其实是最便宜的,需要技术深度的是最贵的。招得到牛逼的架构师,响应式可以拿下,开发成本最低。没有,那不如架构low一点但是hold得住,多招几个普通水平的开发,也比玩脱好。

妙妙容问:

现在Google推AMP,用AMP的话,相当于另外的子页面了,与响应式设计是不是不同呢?AMP与响应式设计(如Bootstrap框架),Zac老师怎么推荐?

答:

用AMP的话,要用canonical标签,Google是知道一一对应关系的。使用响应式设计,也还可以做AMP,并没有矛盾。如果只能做一个,我会选择响应式设计,AMP基本上只是解决速度问题,这个可以通过优化代码、功能、服务器等在很大程度上解决,并不必须要用AMP。如果对你们技术部门来说实现AMP很简单,那不妨做一下,反正没损失。如果忙得四脚朝天,那不妨先不做。

百度MIP也是如此。

郴州SEO问:

整个网站所有页面无论栏目还是内页全部采用 http://www.XXX.COM/XXX/
这种一级目录的方式可以吗?

答:

可以,如果你看得清这个页面是目录还是内页,内页又是属于哪个目录的话。对稍大点的网站,我个人是很难记得清的。另外,对收录监控、流量分析都可能造成一些困难,因为你没办法把页面类型分开了。

再强调一遍,我写的SEO规范中的处理方法不是唯一解,也可能不是最优解。重要的是得有个规范,大家都遵守,省得犯致命错误。

作者: Zac@SEO每天一贴
版权属于: 中新虚拟主机
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

35 条评论 “关于SEO技术规范的一些说明

  1. 我是从SEO入行,后来转做开发的,看这个博客也看了10年了。关于「响应式」这个问题,我觉得回答不是很好,想从技术的角度补充一些。

    移动站点开发现在主流的方式有三种:独立域名、客户端响应式、同域名下服务端返回不同内容(RESS)。

    独立域名方案的前后端架构成本都不高,但是一件事情做两遍,开发成本翻倍。另外SEO方面需要了解canonical元信息。

    响应式是一个后端架构成本低,前端架构成本很高的方案。一套前端代码要适配各种桌面显示器、横竖屏平板、横竖屏手机,方案维护成本非常高,不易变更。开发方面的成本有所降低,但有限。内容精简在前端实现,更多是视觉上的,移动端流量浪费的问题在国内还是需要关注,国内的4G没有宣传的那么快,至少图片响应式必须做。如果要考虑视障人群(国内部分大厂已经很关注这块了,包括我厂),兼容voiceover的体验,前端的架构成本会更高,开发规范也必须严格执行。

    RESS,在后端就对用户进行一定的区分,对不同的设备返回不同的内容,以降低前端响应式的成本。这个方案相当于把上面两个方案揉到一起,取长补短。前后端都有架构成本,但相对比较容易接受。SEO方面需要了解HTTP Vary头。开发方面也有额外的成本。

    开发和SEO一样,做80分的成本并不是做100分的80%,实际可能只有50%,甚至20%。所以选型到底怎么选,很多时候要考虑手里技术资源的实际情况。堆人可以解决的开发成本,其实是最便宜的,需要技术深度的是最贵的。招得到牛逼的架构师,响应式可以拿下,开发成本最低。没有,那不如架构low一点但是hold得住,多招几个普通水平的开发,也比玩脱好。

  2. Zac前辈,请教您一个问题.就是我公司一个网站被另一家网站全版套用了,仅仅是把品牌词换了(换成一个叫千赢的品牌,这个千赢是涉及违法的千赢国际官网),而且,套用我公司网站的公司是一家怎么也联系不上得外地公司,通过站长工具可以看到这家公司建的这个网站,除了在12377举报外,有没有更好的解决方法?

    1. 做好证据保全,有法律承认的证据,联系域名注册商和主机服务商,要求他们关闭网站,不理的话给他们发律师信。没有哪个服务商会为了一个客户冒险的。

  3. 分析的很到位,感谢zac,把你推荐给我的小伙伴了!想请教我目前做SEO遇到的一个问题:

    我操作的一个新站目前收录排名都很好,稳定上升中,每天更新文章多数原创,而且字数500+,但我看同行网站的文章,就只有一个标题、内容不超过200字符疑似复制过来的、加上1-3张图片。

    但是排名非常不错,这就让我郁闷了,查了网站的外链也没见发过,甚至内链都没链接过这篇文章关键词。

    更让我郁闷的是全站基本上都是这样,简直和采集站没多大区别啊,一天更新的内容还比我多、快,长尾词嗖嗖的就上去了。

    zac老师,能分析一下这种类型的站点咋弄的么?请教一下

    1. 我这个老司机来回答你这个问题。
      1,老网站本身权重和信用度就高,百度是会容易收录的,你想,如果新浪网发一些垃圾内容你觉得百度会收录吗?也最是会秒收录的。
      2,内容抄袭作弊要看比例,如果大部分原创少量抄袭,影响基本不大,如果大的话估计也不会收录反而会被惩罚。
      3,你目前是新站,就不要去跟老网站比,做好自己的站内文章 不去抄袭作弊,用心经营好自己的网站吧。
      4,百度对原创一直加大力度,伪原创和采集为主的网站 早晚是会得到惩罚,只是时间问题。把自己的站开通原创保护,实时推送给百度,不用担心被老站抄袭了。
      5,以上个人见解,希望对你有用,加油。

  4. 例如:深圳seo优化_深圳SEO技术_深圳SEO博客_深圳SEO教程 – 网站名称
    这样的一个标题该怎么简化?连接符是否有问题

    1. 连接符本身无意义,主要起个分隔的作用。
      标题简单方法有多种,SEO博客标题怎么设置都没太大的问题。
      提供一个:深圳SEO优化教程博客-XXX,这个已经很精简了,当然也有其他种写法。

  5. 好详细,反复看了几遍,总是感觉自己负责的网站很多地方没做到位,但是限制于系统,不知道怎么调整。
    最特别的就是原有内容修改,会自动变更URL(文章/产品ID会同时更新),然后原ID会删除。
    这个应该是不是应该技术方面来做修改

留个言呗:

您的邮箱不会被显示在页面上。标有*的是必填项。