该系列的之前两篇文章已经把几乎所有SEO的思想都涵盖了,如一开始说的那样,SEO无非是去对搜索引擎友好、或是对搜索引擎的用户友好,不可能有再多的了。接下来就会陆陆续续提一些更细节的东西。因为在群博的公开环境下能够分享的内容有限,所以会偏向一些和SEO效果未必有直接关系,但也应该被SEO所注重的技术层面方面的内容。
对于SEO而言,良好的URL结构是什么样的?和前面的文章一样,让我们来看下SEO顶尖网站Amazon的做法,这是它的一个产品页:
http://www.amazon.com/Zune-Video-MP3-Player-Platinum/dp/B002JPITY8
1.
URL的第一段是产品名,以中划线分隔——Google在其网站站长工具帮助中推荐过的符号(略有类似的,百度搜索引擎友好指南中提出网页标题与网站名称间的分隔最好是下划线。当然这些和搜索引擎的识别机制无关,它们无论如何都不可能认不出这些是分隔符,但对于用户而言会是相对更友好的。)
2.
dp,或许指的是Detail Product,是产品页面的特殊标识。只要有这一段URL在,无论是在流量统计工具或是日志分析中,都可以非常方便的把产品类型页面的流量等情况给细分出来。
3.
B002JPITY8此类的是商品的ASIN码,对于每个产品这都是独一无二的,这样能保证商品绝对不会重复发布。是每一个产品的唯一标识。
但这样的URL也存在着一些问题,比如访问:http://www.amazon.com/abcdefg/dp/B002JPITY8这样的URL,也会出现和前面相同的页面。万一这些页面被搜索引擎收录的话,至少是对SEO绝无好处的。(不排除少数情况下竞争对手会以此陷害自己网站SEO的可能性)
那么技术上的解决方案是什么呢?如果去问程序人员,他们或许给出的方案是:当页面被请求时,读取URL第一段,并将其与产品的名字对比。如果吻合即返回正常页面,不然抛出404异常。
但SEO上面有更好些的方案,直接输出一个canonical属性来指定规范的网址就好了,Amazon正是这么做的。这是一个用来处理网址规范化的标签,在Google网站站长工具帮助里面有说明:http://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=139394(而百度是否支持canonical标签我也不确定)
但Amazon做的还不止是这些,对于URL第三段的ASIN码,还有其它玄机在。这是Amazon官网上对ASIN码的说明中的一小段:
You will find an item’s ASIN on the product detail page alongside further details relating to the item, which may include information such as size, number of pages (if it’s a book) or number of discs (if it’s a CD).
大意是很多对于产品而言很多关键的参数信息,都被记录在了这短短一小段ASIN码中,这样数据分析的时候就能以它来判断哪类产品卖得好等等。且加密过的ASIN码也可以使得竞争对手无法轻易的获知自己的信息。
综合已经提到的一些,和另一些限于篇幅还没提到的因素,这边将URL结构在SEO里面额外需要注意的地方按大致重要性列出:
1. 唯一性(保证页面不能重复)
2. 易分析性(最多用一个简单的正则即可将一类页面细分出来,能够不用正则的话最好)
3. 语义化(如example.com/blog/1.html, example.com/gallery/2.html,让用户只通过看URL就知道自己将访问的是什么样的页面)
4. 程序实现起来的效率
没法说那一种URL结构绝对是完美的。依网站类型、规模等等因素的不同,也得看网站技术架构上如何更便捷,可能还要参照其它各个部门的需求,最终的URL形式自然是需要权衡各方面的利弊来得出的,这边也就不妄论了。
原文地址:http://semwatch.org/2012/03/seo-practice-4/