如何以SEO的角度来优化网站的URL连接地址

作者:马海洋 更新时间:2023-05-25 21:55

对于一个网站的结构来说,URL的设计也非常的重要,在URL设计时我们应该事先做好规划,应该从用户体验和搜索引擎蜘蛛体验出发,在总体上边应该做到 URL清晰、友好、方便记忆,然后还要适当的考虑对于搜索引擎排名的影响,具体来说,马海祥觉得URL设计时我们要从以下几点来着手:

 

1、URL越短越好

一般来说,网站的URL越短越好,这样做主要是为了用户体验,其实对于搜索引擎来说,不超过1000个字母都没有问题,可是如果不考虑用户体验,确实真的用了非常长的URL的话,用户看起来就有些麻烦了,甚至会马上离开你的网站。

曾经有人做过这方面的试验,在搜索引擎的搜索结果中,一个较短的URL出现在一个较长的URL下边时,较短的URL的点击率是较长的URL的2.5倍。

而且较短的URL也比较有利于复制与传播,人们都比较喜欢简单的东西,特别是现代,人们不喜欢太复杂的东西,能简单就简单,所以网站的URL要尽量的短。

2、目录层次尽量少

这里所指的目录层次是指物理目录结构,而不是指逻辑结构(具体可查看马海祥博客《物理结构(扁平结构和树形结构)与逻辑结构之间的关系区别》的相关介绍),我们在进行URL的设计时,网站的结构要尽量的去减少目录层次,层次不能太深了,一般建议不要超过三层,特别对于一些新站来说,权重低,搜索引擎蜘蛛爬行得很浅,深一点的页面,蜘蛛都很可能不会去爬行的。

所以,要尽量的做到使目录层次减少,URL缩短,根据马海祥的长期观察,百度尤其比较喜欢目录层次比较少的页面。

3、文件名及目录名要具描述性

文件名及目录名要具有可描述性,不但让用户一眼就能看出来这个页面是关于什么的,对用户体验比较友好,而且搜索引擎也比较喜欢这样的URL。

例如一个关于新闻的目录,我们可以把它命名为seo,用户看到这个目录名称,大概就知道这个目录是关于什么内容的了。

4、URL中包含关键词

关键词出现在URL中,可以提高一定的相关性,尤其对于优化英文网站,这点非常的重要,而且关键词出现在URL的位置越靠前越好,也就是说出现在域名中最好,其次是出现在目录名中,最后才是出现在文件名中(具体可查看马海祥博客《域名包含关键词是否有利于SEO优化》的相关介绍)。

在此,马海祥提醒大家注意一点的是不要出现关键词堆积的现象,例如许多朋友的SEO博客,在网站的域名中就包含了SEO,这对于关键词的排名来说,具有一定的权重优势。

5、使用目录形式,还是文件形式?

大部分的CMS系统都可以把页面的URL设置为目录或者文件形式,有些朋友认为目录形式比文件形式权重要高一点,无论使用哪种形式的URL,权重应该是差不了多少的,基本可以忽略二者之间的权重差异。

另外,马海祥认为使用目录形式有一个优点,以后如果更换其他的编程语言,URL也可以不用变化,也不用经过特殊的处理,而文件形式的URL可能文件的扩展名会变化,需要做一定的URL重写处理。

上边是一个网站的URL在设计的时候,应该注意的八个问题,在设计URL时,只有严格的按照这几点来操作就可以了,网站的URL设计得好,不但利于蜘蛛的爬行,而且用户看着也简单、易懂。

6、URL中的字母全部用小写

对于为什么URL中的字母全部用小写,马海祥认为这里有以下原因:

(1)、全部用小写,用户比较容易输入,不用因为大小写混合而出现错误,这是人们的输入习惯。

(2)、有些服务器是区分大小写的,例如Lunix服务器,这样在站长做链接或者是用户输入时,会因为大小写的问题而出现404错误,而且robots也是区分大小写的,如果大小写搞错了,可能会造成不能收录的严重问题。

所以,马海祥建议所有的URL都使用小写。

7、连词符的使用

目录或者文件名中如果有两个单词组成时,一般建议中间使用中划线(-)隔开,切记不要使用下划线或者其他字符,在搜索引擎中,它是把中划线当作一个空格来处理的,而下划线则是被忽略的,例如seo-lunwen会被读成seo与lunwen,这是比较友好的写法。

8、URL中要避免太多参数

在进行URL设计时,我们尽量使用静态的URL,虽然现代的主流搜索引擎都能够很好的去索引带有参数的动态网页了,可是,使用静态的URL还是有一定的优势的。

如果由于某些原因,不能使用静态的URL,而不得不使用动态的URL时,设计的则是URL中的参数应该尽量减少,不要超过三个,一般的情况下URL中的参数2-3个就可以了。

参数太多了不但用户看起来困难,对搜索引擎的索引可能也会造成一定的问题,所以,能使用静态就使用静态的URL,能短就尽量短。

9、URL网址规范化

网址规范化指的是搜索引擎挑选最合适的URL作为真正(规范化的)网址的过程。

比如常见的不规范网址,带www和不带www的域名,以及结尾是否带index.html文件名的页面,就造成同样的首页,出现四个不同的网站地址,对于此不规范的网址的解决,我曾在马海祥博客《如何合并栏目列表分页URL首页链接index.html与第一页的重复》一文中跟大家做个详细的介绍,有兴趣的朋友可以看下。

出现网址不规范的原因有如下几点:

(1)、CMS系统原因 ,使同一篇文章出现不同的URL链接。

(2)、URL静态化设置错误,同一篇文章中有多个静态化URL。

(3)、URL静态化后,静态和动态URL共存,都有链接,也都可以访问。

(4)、加密网站,http://和https://。

(5)、URl中有端口号。

(6)、跟踪代码。

(7)、显示的都是首页内容。

网址规范化问题造成的一些问题:

(1)、分散页面权重,不利于排名。

(2)、外部链接也可能指向不同的URL,分散权重.

(3)、搜索引擎判断的规范化网址不是站长想要的那个网址。

(4)、如果问题太严重,也会影响收录。

(5)、相同内容的页面太多,可能被搜索引擎认定为作弊。

网址规范化解决方案:

(1)、确保使用的cms系统只产生规范化网址,无论是否有静态化

(2)、所有内部链接保持统一,都指向规范化网址。

(3)、在301从定向中,把不规范化URL全部转向到规范化URL。

(4)、提交给搜索引擎的XML网站地图中全部使用规范化网址。

10、URL的命名规则

大部分网站的URL命名规则是“根域名+栏目+文章页面”,也有一部分网站的URL命名规则是“根域名+文章页面”,其中能够产生变数的多半在于文章页面的命名规则上,有很多的朋友可能会注意到自己的命名规则是不太合理的,那么什么样的URL命名规则比较利于搜索引擎抓取呢?

(1)、网站的网址结构应尽可能简单些,并考虑网站组织的内容,让网址的构建合乎逻辑并易于理解(尽可能采用易读字词而非长的ID数字)。

(2)、马海祥建议您在网址中使用标点符号,帮助搜索引擎更好地分析网页内容,如在网址中使用连字符(-)而尽量避免使用下划线(_),用连字符分开两个单词,更有利于搜索引擎蜘蛛进行语义分析。

(3)、尽量少使用复杂的网址,特别是那些包含多个变量参数的网址(URL静态化),因为其可能会产生大量不必要的网址全都指向您网站上相同或相似的内容,给抓取工具带来麻烦,消耗大量不必要的带宽,也可能无法为您网站的所有内容编制完整索引。

马海祥博客点评:

当然,URL的结构优化还涉及到其他的一些细节,其中一个重要的就是对于后期URL权重的可控性的把握,例如,在开始的时候我们需要做长远考虑,给网站设计了很多的栏目,但是这些栏目又不是第一阶段我们想投入精力的,在这个时候我们可以将这些栏目进行robots屏蔽掉蜘蛛,或者使用nofollow标签让权重不传递,到达对于网页权重的合理引导,后期如果我们有精力开始发展新的栏目,就放开搜索引擎蜘蛛的抓取权限就可以了。