第5章

    页面优化

    本章讨论页面本身可以优化的元素。页面和网站结构是SEO自己可以控制的,优化好这两方面就给网站SEO打下了良好的基础。

    5.1 页面标题

    页面标题是包含在Title标签中的文字,是页面优化最重要的因素。

    标题标签的HTML代码格式如下:

    alt

    用户访问时,页面标题文字显示在浏览器窗口最上方,如图5-1所示。

    alt

    图5-1 浏览器窗口显示的页面标题

    在搜索结果页面上,页面标题是结果列表中第一行文字,是用户浏览搜索结果时最先看到的、最醒目的内容,如图5-2所示。

    alt

    图5-2 搜索结果列表中的标题

    建议Title紧接着写在<head>之后,然后再写其他标签和代码,尤其不要在中间插上一大段JavaScript程序,这样搜索引擎可以迅速找到标题标签。

    页面标题的优化要注意下面几点。

    5.1.1 独特不重复

    即使在同一个网站内,主题相同,不同页面具体内容不会相同,页面标题也不能重复,每个页面都需要有自己独特的标题标签。不同页面使用相同的标题是不了解SEO的站长经常犯的错误之一,就连一些重要的IT人物和大网站也经常会犯这个错误。

    最常见的重复标题是忘记写标题标签,使用了编辑软件新建文件的默认标题。在中文页面上经常表现为“未命名文件”,在英文里则显示为“Untitled Document”。如图5-3所示,在Google搜索Title中包含“Untitled Document”的文件,返回8500多万个结果。

    alt

    图5-3 大量以“Untitled Document”为标题的页面

    搜索串中加了一个“的”字,目的是只显示中文页面。通过图5-3可以看到,很多教育机构的页面经常不写标题标签。

    再看如图5-4所示的比尔·盖茨的博客。

    alt

    图5-4 比尔·盖茨博客的重复标题

    虽然写了标题标签,但标题都是一样的。很多企业网站也是如此,如图5-5所示。

    alt

    图5-5 企业网站的重复标题

    标题是页面优化第一位的因素,是搜索引擎判断页面相关性最重要的提示。不同页面使用重复标题是极大的浪费,用户体验也不好,搜索用户无法从页面标题看出这个页面到底是什么内容。

    小网站经常需要人工撰写最合适的标题标签。大型网站页面数量众多,不可能人工撰写,需要通过程序调用页面上特有的内容生成标题。最常见的是最内页直接调用产品名称或文章标题,分类页面使用分类名称,首页建议人工撰写。

    使用重复标题经常是因为疏忽。要检查网站上是否有重复标题,可以使用Google站长工具,故障诊断-HTML建议部分会列出使用了重复标题的页面,如图5-6所示。

    可以看到,我的博客很多存档页面有重复标题。这里提醒读者一下,我的博客“SEO每天一贴”并不是一个SEO范例,有很多该优化的地方没有优化,标题的撰写只是一例,读者如果仔细研究会发现更多。原因是我的博客没有商业性,排名和流量对这个博客没有什么意义。所以不要盲目模仿我的博客,SEO方法请以本书中所介绍的为准。

    alt

    图5-6 Google网管工具列出有重复标题的页面

    有的时候要生成独特标题并不是一件简单的事,比如电子商务网站的分类页面,同一个分类下产品数量比较多时,产品列表页面必然需要翻页,大型网站可能会翻几十到几百页。这些分类页面的标题通常都是“分类名称-网站名称”格式。这时程序员就需要在标题中加入页数,使翻页页面标题标签不同。分类第一页不必加页号,从第二页开始页面标题最前面加上“第二页”、“第三页”等文字,形成的标题大致如下:

    第一页:

    分类名称-网站名称

    第二页:

    第二页-分类名称-网站名称

    5.1.2 准确相关

    这一点不言自明。每个页面的标题都应该准确描述页面内容,用户看一眼就能知道将访问的页面大致是讲什么的,搜索引擎也能迅速判断页面的相关性。

    很自然,准确描述页面内容,就必然会在标题中包含目标关键词。唯一要注意的是,不要在标题中加上搜索次数高、但与本页面无关的关键词。这种方法七八年前还管用,现在早已没有任何效果,弄不好还会被认为是作弊。

    5.1.3 字数限制

    从纯技术角度说Title标签可以写任意长度的文字,但搜索结果列表页面标题部分能显示的字数有一定限制。百度最多显示30个中文字符,Google显示65个英文字符,转成中文大概是32个字符。Title标签中超过这个字数限制的部分将无法显示,通常在搜索列表标题结尾处以省略号代替。

    前面介绍过,用户搜索的关键词会在显示的标题中被加红色高亮。如果搜索词位于Title标签后面超出显示字数部分,百度会显示Title中后面包含关键词那部分文字,前面加省略号。如搜索“site:dunsh.org论坛”,有的页面显示如图5-7所示。

    alt

    图5-7 百度有时候因搜索词位置显示标题后半部分

    页面的实际标题如图5-8所示。

    alt

    图5-8 页面标题长度超过百度能显示的字符数

    所以标题标签不要超过30个中文字,为保险起见最好不要超过25个中文字。实际上为了提高用户体验及突出目标关键词,我通常建议标题标签以15~20个中文字比较适合。

    标题标签之所以不宜超过搜索结果列表所能显示的字数限制,主要有三点原因:

    (1)搜索结果列表标题不能完整显示时,结尾会被切断,而站长又不容易预见在什么地方被切断。如图5-9所示,结尾处的字被拦腰截断,用户不能轻松知道应该是哪个词。

    alt

    图5-9 标题过长被截断

    (2)虽然超过显示字数限制的标题标签并不会引来搜索引擎的惩罚,但超过显示字数的部分搜索引擎会降低权重,对排名作用很小。

    (3)标题越长,在不堆积的前提下,无关文字必然越多,不利于突出关键词相关性。

    5.1.4 简练通顺,不要堆砌

    堆积关键词也是初学SEO的人很容易犯的错误,为了提高相关性,在标题中不自然地多次出现关键词。比如把标题写成:

    女装|女装批发|女装零售|女装批发零售|××女装网

    其实这样的页面只要写成:

    女装批发零售|××女装网

    就可以了。

    SEO人员不仅要考虑搜索引擎,还要考虑到用户,不能让用户一看标题就感觉这是一个为关键词而关键词的页面,而需要把标题写成一个正常通顺的句子。在这一点上百度百科是最好的教材,如图5-10所示。

    alt

    图5-10 百度百科标题简洁

    标题干净利索,一句废话没有。SEO人员都知道现在百度百科在百度本身及Google排名都非常好,简练通顺的标题很可能是重要原因之一。

    5.1.5 关键词出现在最前面

    在可能的情况下,目标关键词应该出现在标题标签的最前面。经验和一些统计都表明,关键词在标题中出现的位置与排名有比较大的相关性,位置越靠前,通常排名就越好。

    对网站内页来说,通常是按:

    产品名称/文章标题-子分类名称-分类名称-网站名称

    的格式生成标题标签。

    标题标签可以理解为倒置的面包屑导航,比如页面所在位置的面包屑导航是:

    首页>电子产品>数码相机>索尼数码相机

    那么页面的标题就写成:

    索尼数码相机-数码相机-电子产品-××电器网

    这个页面的目标关键词是索尼数码相机,出现在标题最前面。考虑到字数限制和突出目标关键词,也可以拿掉分类名称,把标题缩减为:

    索尼数码相机-××电器网

    5.1.6 吸引点击

    提高关键词相关度和排名是带来搜索流量的一方面,点击率是搜索流量的另一个决定因素。标题标签能够吸引用户目光,让用户欲罢不能,非要点击看个究竟,才能达到最好的SEO效果。比如这样的标题属于中规中矩的:

    减肥茶-减肥产品-××减肥网

    如果写成这样点击率就可能有所上升:

    减肥茶:无须节食,无须运动,快乐减肥-××减肥网

    减肥茶10天减轻体重5.5公斤,真实用户证言-××减肥网

    减肥茶免费样品大赠送-××减肥网

    索然无味的页面标题即使出现在搜索结果前面也可能很少有人点击,好的标题即使排在后面也可能点击率更高,带来的流量也更大。单纯的排名没有意义,有人点击才有效果。

    好的SEO除了要了解基本优化技术,也得研究用户心理、文案写作等。

    5.1.7 组合两三个关键词

    一般来说,一个页面最多针对三四个关键词进行优化,不宜再多。

    前面抓图显示的亚马逊书店把“图书,手机,数码,家电,化妆品”等都放在首页Title中,如果亚马逊网站这样做真的是想把这么多关键词定位在首页,那么这不是一个好的策略。普通企业和站长不能看到品牌网站这么做就跟着学。亚马逊这种级别的网站流量肯定不能靠SEO,页面优化得怎样并不那么重要,而且大部分东西不是从SEO角度出发的。

    要针对四五个或更多关键词优化页面,往往使页面内容不能突出,文案写作上也会顾虑太多,无法自然融入这么多关键词。一个页面如果需要优化很多关键词,往往是关键词研究没有做好,没有正确把关键词分组并分布到各个栏目和内页中。

    有的时候,两三个关键词只要并排放在标题标签中即可。比如你可能在做关键词研究时发现“韩版女装”和“韩国女服”这两个词搜索次数都不少(只是假设),而这两个词的意义显然完全一样,在标题中写成这样就可以了:

    韩版女装,韩国女服-××服装网

    有的时候三四个关键词还可以组合为更通顺的一个词组。在写这一节时,刚好浏览zaccode.com网站看到一个朋友问,如果页面想优化“SEO技术”,“SEO教程”,“SEO”,“免费SEO”这四个词,该怎么写标题?我的回答是:

    免费SEO技术教程

    这是一句很通顺的话,而且搜索引擎可以拆分、组合出所有目标关键词。后面的案例部分还有更多实际的例子。

    当然,这样组合出的关键词有时不是完整匹配,比如上面例子中的“SEO教程”就不是完整匹配出现在标题中的。但与用户体验相比,为了刻意完整匹配而用一个不自然的标题,如这样:

    SEO-SEO技术-SEO教程-免费SEO

    我建议还是首先考虑用户体验。而且不自然的文字可能被搜索引擎认为有作弊嫌疑。

    把多个关键词组合为一句更为通顺的词组或句子,没有适用于所有情况的规则,只能自己发挥创意,不断练习,做久了自然熟能生巧,既能包含主要关键词,又让用户觉得没有优化痕迹。

    5.1.8 公司或品牌名称

    通常把公司或品牌名称放在标题的最后是个不错的做法。虽然用户在搜索公司名称、网站名称时,一般只有首页才会被排在最前面,分类页、具体产品页等内页既没有必要,也没有可能针对品牌名称做优化,但是品牌名称如果多次出现在用户眼前,就算没有点击也能让用户留下更深的影响。

    有的时候品牌名称比任何关键词都重要,写标题时关键词就不是考虑的重点了。例如搜索“网上银行”的次数不少,但银行网站首页标题如果写成这样:

    网上银行,网上银行查询转账-招商银行

    那就真是捡了芝麻,丢了西瓜。

    5.1.9 连词符使用

    标题标签中词组之间需要分隔时,既可以使用空格,也可以使用连词符-│>·_等。这些连词符在排名上没有什么区别,用哪个都一样,但是在显示出来的视觉效果上可能有不少差别。选用哪个连词符,只取决于你认为哪种符号能让用户看得最清楚、看得最舒服。个人认为->│都是不错的选择。

    5.1.10 不要用没有意义的句子

    标题标签是最宝贵的优化资源,不要浪费在没有意义的句子上。诸如“公司欢迎您”,“用户是我们的上帝”之类,既不能提高相关性,也不能吸引用户目光和点击量。

    5.1.11 noodp标签

    网站被开放目录收录时,Google、雅虎、必应有时候会取开放目录中的标题作为搜索结果列表中的页面标题,而不使用页面本身的Title标签内容。而开放目录中的标题是由编辑确定的,不一定是站长最想要的标题。站长可以使用noodp标签强制搜索引擎不要使用开放目录标题。

    noodp标签放在HTML的head部分,代码如下:

    alt

    标题标签是SEO过程的重点之一,建议大家重要页面都人工撰写,如首页、分类或栏目页、热卖产品页面等。而撰写标题时又需要做最起码的关键词研究,才能知道哪几个关键词搜索次数最多或性价比最高。大型网站很可能有数百个分类及子分类,人工撰写标题是一件费时、费力、但一定有效果的工作。

    5.2 描述标签

    描述标签是HTML代码中Head部分除标题标签外与SEO有关系的另一个标签,用于说明页面的主体内容。描述标签的代码格式为:

    alt

    描述标签的重要性比标题标签低很多。描述标签中的文字并不显示在页面可见内容中,用户只有查看源文件和在搜索结果列表中才能看到描述标签里的文字。

    现在主流搜索引擎排名算法都已经不使用描述标签,所以描述标签对关键词排名没有影响,但是对点击率有一定影响,因为大部分情况下,搜索结果列表中的页面摘要说明就来自描述标签。

    除了描述标签外,搜索结果列表中的页面说明还可能来自另外两个来源。一是搜索引擎自动抓取页面可见文字中的相关段落。尤其描述标签中不包含所搜索的关键词时,搜索引擎经常从页面可见内容中动态抓取包含搜索词的部分显示为说明文字。

    另外一个来源是重要网站目录。网站如果被雅虎或开放目录等收录,搜索引擎也可能会使用雅虎或开放目录的说明文字作为页面说明。与标题标签一样,站长可以使用noodp标签禁止搜索引擎使用开放目录的说明文字。在一些特殊情况下,搜索引擎也可能组合使用上面三种说明文字来源。

    说明文字中的搜索词也以高亮显示,以便于提高点击率。

    当搜索引擎动态抓取可见内容作为说明文字时,通常会从不同段落提取文字,因而句子之间会出现省略号,而且在说明文字的前后、中间都可能出现省略号,如图5-11所示。

    alt

    图5-11 动态提取的说明文字

    搜索引擎动态提取说明文字时,站长就无法控制,所显示的说明文字有可能在重要的地方被截断。所以虽然描述标签不用于排名计算,在可能的情况下还是建议写上描述标签,以便控制页面的说明文字。

    在下面几种情况下,搜索引擎更可能动态抓取它认为合适的说明文字:

    ● 描述标签包含大量堆积关键词;

    ● 描述标签与标题标签内容重复;

    ● 描述标签只是关键词的罗列,不能形成通顺的句子;

    ● 描述标签不包含用户所搜索的关键词。

    在描述标签的写作上,大部分标题标签写作要点依然适用,比如文字需要准确相关、简练通顺、吸引点击,不要堆积关键词,每个页面有自己独特的描述标签,包含目标关键词等。

    与标题标签不同的是,搜索结果列表说明文字部分通常会显示77个中文字符,Google英文结果显示156个英文字符,比标题标签写作空间大一点。为保险起见,建议描述标签不要超过70个中文字。

    小型网站站长可以人工撰写描述标签,用一两句通顺的句子说明页面主题。大中型网站则不可能人工撰写,通常可以采取两种方法自动产生。一是从页面正文中提取一部分,一般会提取第一段文字中的内容。二是从产品重要信息生成,如产品名称、品牌、型号、价格、颜色、生产商等。在可能的情况下,大中型网站的首页及主要分类页面也可以考虑人工撰写描述标签。

    最后要说明的是,如果不能生成恰当通顺、不重复的描述标签,那么就不要写描述标签。

    5.3 关键词标签

    关键词标签是HTML代码Head部分看似与SEO有关、但目前实际上对SEO没有任何影响的标签。关键词标签的代码格式是:

    alt

    关键词标签本意是用来指明页面的主题关键词。十几年前,在关键词标签中重复关键词,甚至加上无关的热门关键词曾经是排名的重要方法。也正因如此,站长们发现了这个方法,立即引来了大规模滥用。所以现在的主流搜索引擎无一例外都没有在排名算法中考虑关键词标签的内容。

    几年前关键词标签还可以用来放异体字、错拼单词等,但是现在的搜索引擎都有错字错拼提示功能,关键词标签的这个用法也失去了意义。

    也许以后搜索引擎还会把关键词标签计入算法,但目前的建议是,不用浪费时间写关键词标签。

    HTML代码Head部分的其他meta标签都对SEO没有影响。

    5.4 正文中的关键词

    页面正文中出现关键词是必要的,也是必然的。

    5.4.1 词频和密度

    正文中的关键词牵扯到两个概念。一个是词频,也就是关键词出现的次数。另一个是关键词密度,也就是关键词出现次数除以页面可见文字总词数,或者说关键词密度是规范化后(考虑正文长度后)的词频。

    最初的搜索引擎算法认为,关键词出现次数越多,也就是词频越高,页面与这个关键词越相关。但词频概念没有考虑内容长度。页面正文如果是1000个词,显然关键词词频很容易比100个词的页面高,但并不必然比100个词的页面更相关。用关键词出现次数除以总词数,得到关键词密度,是更合理的相关性判断标准。

    现在的搜索引擎算法已经比简单词频或密度计算复杂得多。站长可以很容易地人为提高词频和密度,页面价值却不一定更高。所以页面对关键词的相关性与词频和密度已经没有直接联系,SEO人员不必太在意。

    一般来说,篇幅不大的页面出现两三次关键词就可以了,篇幅比较长的页面出现4~6次也已经足够,千万不要堆积关键词。

    初学SEO的人常常问关键词密度是多少最合适。其实关键词密度在现在的搜索引擎算法中已经是一个不太相关的概念,SEO人员完全不必关注。观察排名在前面的页面,我们会发现其中既有密度低到1%或2%的页面,也有高到20%的页面。只要自然写作,页面中必然出现几次关键词,这就已经完成优化了。

    5.4.2 前50~100个词

    正文前50~100个词中出现的关键词有比较高的权重,通常建议第一段文字的第一句话就出现关键词。

    实际上这也就是自然写作的必然结果。和写议论文一样,页面的写作也可以分为论点、论据及最后的总结点题。文章最开头首先需要点明论点,也就自然地包含关键词。接下来的论据部分再出现两三次,结尾点题再次出现关键词,一个页面的可见文字优化就完成了。

    5.4.3 关键词变化形式

    写作页面内容时可以适当融入关键词的变化形式,包括同义词、近义词、同一件事物的不同称呼等。比如电脑和计算机是同义词,可以在页面中交叉出现。笔记本电脑和膝上型电脑也是同义词,减肥和瘦身是近义词,主机、服务器、网站空间基本上说的是一回事,这些词都可以在主体内容中交叉出现。

    英文页面优化中还有一种特殊关键词变化形式,就是同一个词根所生成的各种形式的单词,如work是词根,它的变化形式包括works,worker,workers,working,worked等。这些变化形式交叉使用,使搜索引擎能更快速准确地提取页面主题,并且这些变化形式都有可能被用户所搜索,组合出更多搜索词。

    5.4.4 关键词组临近度

    标题标签和正文写作时应该注意目标关键词组的临近度,也就是说,关键词可以被分词时,在页面上应该完整、按顺序出现关键词组几次,尤其是重要位置,如本节提到的第一段文字,其他节说明的H标签、黑体、ALT文字等。如目标关键词是“SEO方法”,就要在页面上完整出现“SEO方法”,而不是把“SEO”和“方法”分开,分别出现在页面上。

    百度对关键词完整匹配出现的要求比Google高些。

    5.4.5 词组的拆分出现

    搜索词可以被分词时,不仅搜索词要完整匹配出现在页面最有权重的位置,被拆分后的词还可以各自单独出现在正文中几次。

    假设目标关键词是“点石互动论坛”,以百度为例,这个词会被分词为“点石互动”和“论坛”两个词。页面重要位置不仅要完整匹配出现“点石互动论坛”六个字,建议“点石互动”和“论坛”也可以分别单独(不连在一起)出现几次。

    5.4.6 语义分析

    算法和人很不一样的地方是,人可以直接理解词的意思、文章的意思,算法不能理解。人看到“苹果”这两个字就知道指的是那个圆圆的、有汁的挺好吃的水果,搜索引擎却不能从感性上理解什么是苹果。

    但搜索引擎可以掌握词之间的关系,这就涉及语义分析。SEO业界很热烈地谈论过一阵潜在语义索引(Latent Semantic Indexing)。潜在语义索引研究的是怎样通过海量文献找出词汇之间的关系,当两个词或一组词大量出现在相同文档中时,这些词之间就被认为是语义相关的。

    举个例子,电脑和计算机这两个词在人们写文章时经常混用,这两个词在大量的文档、网页中同时出现,搜索引擎就会认为这两个词是极为语义相关的。实际上它们是同义词。

    潜在语义索引并不依赖于语言,所以“SEO”和“搜索引擎优化”虽然一个是英语,一个是中文,但这两个词大量出现在相同的网页中,虽然搜索引擎还不能知道搜索引擎优化或SEO指的是什么,但是却可以从语义上把“SEO”,“搜索引擎优化”,“search engine optimization”,“SEM”等词紧紧地连在一起。

    再比如“苹果”和“橘子”这两个词,也经常出现在相同的文档中,虽然紧密度低于同义词,但搜索引擎可以判断这两个词是有某种语义关系的。

    搜索引擎有没有使用潜在语义索引,至今没有定论,没有搜索引擎承认或否认。但一个事实是,2002年Google买下了拥有潜在语义索引专利的一家公司Allied Semantic。

    这种语义分析技术可以在搜索引擎优化上给我们一些提示。

    从大概2004年开始,Google排名有一个现象,搜索某个关键词,排在前面的网页有时甚至并不含有所搜索的关键词,除了链接锚文字外,很有可能是潜在语义索引在起作用。比如搜索“电脑”,排在前面的有可能包括一篇只出现“计算机”却没出现“电脑”这个词的页面,因为搜索引擎通过语义分析知道这两个词是紧密相关的。

    在进行网页写作的时候,不要局限于目标关键词,应该包含与主关键词语义相关、相近的词汇,以支持主关键词。

    假设优化“培训”这个词,要加强相关性,并不是多出现几次“培训”这么简单,还可以通过出现其他语义相关词汇。和“培训”语义相关的词包括:老师,学生,理论,技巧,师父,徒弟,考试,实践,学校,师资,教育等。由于语义分析的因素,这些词在搜索引擎眼里是比较相关的,在写内容时,就要把这些词符合逻辑、符合语法地融入进去。

    5.4.7 分类页面说明文字

    大部分网站首页及最终产品或信息页面优化并不困难,有足够的内容可以安排关键词,但分类或频道页面往往被忽视。分类和频道页面最常见的内容就是产品或文章列表,而产品名称或文章标题实际上都是产品或具体信息页面的重复内容,这就造成分类页面缺少自己的独特内容。

    而分类或频道页面的目标关键词往往是排在第二层次的搜索次数比较多的词。要想充分优化这类关键词,就需要人工撰写分类或频道页面的说明文字,最好有至少两三段说明文字。

    从SEO角度看正文中的关键词优化,最主要的还是自然写作。一些单页面网站,站长可以精雕细琢关键词分布、用词,但绝大部分网站制作时,无论是编辑还是专业SEO人员,都不可能时刻想着关键词密度、同义词、语义相关词、词组的拆分等细节,那样做效率太低。其实只要自然写作,上面讨论的这些方面就自然而然地做到八九不离十了。

    如果头脑中能有关键词在重要位置的分布、同义词近义词使用、语义相关、词组的拆分组合等观念,写作时从有意识到下意识地运用这些方法,再好不过了。

    更重要的是针对用户及转化率的写作。对用户有帮助的原创内容,强调卖点,消除购买顾虑,排版格式清晰易读,适当的地方加上图片美化等,都可以提高转化率。

    5.5 H标签

    H标签相当于正文标题,是关键词优化的另一个页面元素,通常认为重要性仅次于页面Title。近两年Google给予H标签的权重有所降低。

    H标签按重要性分为六层,从H1到H6。H1的HTML代码是:

    alt

    H1最重要,H6重要性最低。在H1和H2标签中融入关键词,有助于提高相关性。H3以下的标签权重已经很低,和普通页面文字相差不多了。

    H标签对应于文章的正常结构。文章一定会有一个标题,应该使用H1标签,其中包含最重要的关键词。文章中出现小标题,使用H2标签,可以包含辅助关键词或相关词语。如果还有更小的标题,可以使用H3。再低层的标题意义不大,不仅使文章结构过于复杂,搜索引擎给予的权重也很低了。

    典型的H标签使用结构:

    alt

    要注意的是,H标签在视觉表现上常常是黑体,但其语法意义与黑体完全不同,不要在页面上滥用。一般来说一篇文章只有一个标题,H1也只出现一次。大量使用H1、H2,反倒使得关键词不能突出。整篇文章都放进H标签中,就和完全没用H标签一样了。

    5.6 ALT文字

    ALT文字是指图片的替换文字。代码如下:

    alt

    在某些情况下,比如用户浏览器禁止显示图片,或由于网络等原因图片文件没有被下载完成,以及视障人士使用的专用浏览器,导致图片不能被正常显示,图片ALT属性中的文字将被显示在页面上,如图5-12所示。

    alt

    图5-12 图片未显示时出现ALT文字

    某些浏览器,如IE7以前的Internet Explorer,鼠标放到图片上时,ALT文字也会被显示出来。

    图片ALT文字中出现关键词对页面相关性也有一定影响,近一两年ALT文字重要程度还有所提高,所以在图片ALT属性中以简要文字说明图片内容,同时包含关键词,也是页面优化的一部分。

    与页面Title一样,ALT文字中不要堆积关键词,只要出现一次关键词即可。

    图片做成链接时,ALT文字就相当于文字链接的锚文字。所以网站左上角出现的公司logo,应该在alt文字中包含首页目标关键词。logo一般都链接到首页,而且通常是页面上出现的第一个连到首页的链接,ALT文字中包含关键词,就相当于文字链接锚文字中包含关键词。

    图片文件名中包含关键词对图片本身出现在图片结果中,以及所在页面的相关度也有一点影响。这种优化主要用在英文网站上。中文网站用中文关键词做图片文件名,和关键词出现在URL中类似,作用不大,有的时候得不偿失。

    5.7 精简代码

    在搜索引擎工作原理一节中介绍过,搜索引擎预处理的第一步就是提取文字内容。SEO人员应该尽量降低搜索引擎提取文字内容的难度,也就是精简HTML代码,使真正的文字内容比例提高,尽量减少HTML格式代码。从某种意义上来说,格式代码对关键词来说都是噪声,精简代码就是提高信噪比。

    常见的可以精简代码的地方如下。

    (1)使用CSS定义文字字体、颜色、尺寸及页面排版。有很多网站既使用CSS,又在可见文字部分用style或font再定义一遍字体、尺寸等,这是完全没有必要的冗余代码。

    (2)使用外部文件。将CSS和JavaScript放在外部文件中,页面HTML中只要放一行代码进行调用就可以了。如果我们查看一些网站源文件,经常可以看到大片大片的CSS及JavaScript代码,而且JavaScript代码还经常出现在HTML最前面,这就使真正有用的文字部分被推到后面。

    (3)减少或删除注释。代码中的注释只是给程序员或页面设计人员的提示,对用户和搜索引擎来说毫无作用,只能成为噪声。

    (4)减少表格,尤其是嵌套表格。现在的网页大多使用CSS排版,表格使用大大减少。但有的时候使用表格展现是必需的,也不必刻意完全避免,只要不出现多层嵌套表格,产生大量无用代码就可以了。

    这里说明一下文件大小限制。Google技术指南曾经建议,HTML文件最好限制在100KB以下,页面上链接数在100个以下。百度目前建议HTML文件不要超过128KB。其实现在的搜索引擎已经完全可以抓取大得多的文件,甚至一两兆的文件也没有问题。

    不过在可能的情况下,还是应该尽量使文件越小越好。虽然搜索引擎可以抓取很大的文件,但可能不索引整个文件,而只索引文件前面一部分内容。通常,页面内容应该是集中统一的,索引前半部分就代表了文件内容主题。文件很大时,索引整个文件既没有必要,也是很大的资源浪费。文件过大,再加上大量冗余格式代码,可能使实质内容被推到实际被索引的部分之外。

    5.8 内部链接及锚文字

    网站架构一章讨论过,内部链接对爬行和收录有非常重要的意义。内部链接对页面关键词相关性也有影响,最主要的就是在内部链接中使用锚文字。

    锚文字是告诉搜索引擎被链接页面主题内容的最重要依据之一。外部链接锚文字大部分是无法控制的,内部链接锚文字则完全由站长控制。锚文字中出现完全匹配的关键词,有助于提高链接目标页面的相关度,以及发出链接页面的相关度。当然在这方面还要避免过度优化。除了一部分使用完全匹配关键词做锚文字外,最好有一部分锚文字具有自然多样性。

    锚文字出现的位置不能集中在导航或页脚中,而需要分散在正文中。在页脚加上很多重要页面的链接,锚文字使用完全匹配关键词,曾经是一种很流行的优化方法,效果也曾经很明显。不过近一两年这种页脚过度优化常常是排名惩罚的原因之一。

    5.9 导出链接及锚文字

    链接对搜索引擎排名的重要性被越来越多的站长所了解和重视,造成很多网站惜链如金,不愿意导出链接到其他网站上。实际上导出链接到外部网站对发出链接的页面相关性也有一定影响。

    比如说一个页面以“减肥方法”为锚文字链接到另外一个网站上的页面,一方面说明被链接的页面应该是在谈减肥方法,另一方面说明发出链接的页面本身也应该是与减肥方法相关的。不然一个谈笔记本电脑的页面,有什么原因要链接到一篇关于减肥方法的文章呢?所以链接到相关、高质量的外部网站,也有助于提高页面本身的相关性。

    在搜索引擎链接原理部分我们讨论过枢纽和权威页面的关系,得到链接的往往是权威页面,而指向权威页面的往往是枢纽页面。如果不能成为权威页面,第二选项就是成为枢纽页面。导出外部链接就是成为枢纽的方法。

    5.10 W3C验证

    页面HTML代码兼容性相差很大,各种操作系统的不同浏览器,甚至相同浏览器的不同版本解析HTML时都不同,越来越多的人在考虑W3C验证对SEO有什么影响。从经验和观察来看,W3C验证通过与否对页面排名没有明显影响。只要页面没有严重错误,使搜索引擎无法提取文字内容,就不必太在意W3C验证。

    实际上绝大部分页面都无法百分之百通过W3C验证,搜索引擎也非常清楚这一点。SEO人员可以尽量更正验证报告中的错误,警告信息通常可以忽略。

    5.11 黑体及斜体

    黑体、斜体是页面文字很早就使用的格式,将关键词设为黑体或斜体有一点点强调作用,搜索引擎也给予黑体、斜体中的文字比普通文字多一点权重,不过权重并不大。尤其是斜体使用需要很慎重,中文斜体对用户不友好,不容易辨认。在可能的情况下,适当使用黑体有些作用,但这属于非常细节的地方,不必过于关注。

    黑体有时有助于帮助分词。比如为避免搜索引擎把“搜索引擎优化”这几个字分词为“搜索”、“引擎”、“优化”三个词,可以把“搜索引擎优化”全部设为黑体,帮助搜索引擎理解,这六个字实际上是不应该分开的一个词。

    5.12 页面更新

    对某些有时效性的网站来说,如博客和新闻网站等,页面更新也常能提高排名。Google和百度都有这样的现象,刚发布的文章很快能有比较好的排名,但过几天后排名会下降。更新内容使搜索引擎认为内容有时效性,更相关。

    页面更新频率也是吸引搜索引擎蜘蛛返回抓取的因素之一。

    5.13 Google沙盒效应

    所谓沙盒效应(Sandbox Effect),指的是新网站在Google很难得到好的排名,无论怎么优化这个网站。换句话说,一个新的网站,可以有很丰富的、相关的内容,可以有大量外部链接,网站既搜索引擎友好,也用户友好,所有一切都优化得很好,但是在一段时间之内,就是很难在Google得到好的排名,尤其是竞争比较大的关键词。

    这个现象最早是在2004年3月开始被注意到的。Google的Sandbox有点像给予新网站的试用期,在这段试用期内,新网站几乎无法在搜索竞争比较激烈的关键词时得到好的排名。

    沙盒效应更多地发生在竞争比较激烈的关键词上。那些不太商业的,竞争比较小的关键词,发生沙盒现象的机会就比较小。进入沙盒的网站,搜索竞争大的主关键词找不到,搜索竞争比较小的关键词时则排名正常,收录也正常。

    有的新网站一开始就有非常强的外部链接,如某些成为社会热点的网站,也可能不进入沙盒。

    有时候老网站也可能因为短时间内增加大量外部链接而进入沙盒。

    沙盒本身不是一个独立的、把所有新网站排名暂时调后的过滤算法,而是很多其他排名因素所造成的一种效应或现象。比如,Google把域名年龄、链接的年龄、链接页的历史情况、网站获得链接的速度都考虑在排名算法内,这些与时间有关的因素组合起来,就可能对新网站产生沙盒现象。

    大部分人认为Google之所以会考虑产生Sandbox效应的时间因素,是为了清除垃圾网站。通常垃圾网站建站后会快速买大量链接,得到好的排名,赚一笔钱后,作弊手段被发现了,网站被删除或被惩罚,但是作弊者也不在乎,这个域名也就被放弃了,转而开始做另外一个新的网站。Google有了Sandbox以后,一部分垃圾网站制造者没这么多耐心等他的网站从沙盒里出来,所以也就不建垃圾网站了。

    通常沙盒效应会维持几个月,长的也有一两年的。关键词竞争不大的网站在沙盒里时间会短一些。行业竞争越高,沙盒效应越长。

    虽然沙盒现象首先在Google排名中被观察到,也通常被称为Google沙盒,其实其他搜索引擎也有类似现象,只不过没有Google这么明显。

    网站进入沙盒,SEO人员该怎么办呢?首先要放宽心,因为从根本上说,站长没有好办法逃避沙盒现象。随着时间的推移,过大概6个月以后,新网站或新域名自然会从沙盒里出来。

    同时,当网站在Sandbox沙盒里时,应该利用这段时间增加网站内容,建设外部链接,踏踏实实做好网站。实际上,沙盒效应对很多网站运营者来说可能是一件好事。因为在大概半年的时间里,只能把精力放在网站内容上面,而不会去考虑排名。从长远来看,一旦走出沙盒,外部链接的年龄足够长了,被记入算法当中,网站也有了足够的内容,排名会有一个质的飞跃。

    大家可以看到,本书中“页面优化”这一章篇幅是最简短的,因为页面上能优化的地方就这么多,优化方法也相对固定。只要在重要的地方,如Title、H1、alt文字、链接锚文字等地方出现关键词,避免在任何地方堆积关键词就可以了。相比外部链接及网站结构来说,页面优化是比较简单的部分。在搜索引擎排名算法中,页面本身的优化只占20%~30%的比重。