3.4 关键词密度
关键词密度(Keyword Density)也叫关键词频率(Keyword Frequency),所阐述的实质上是同一个概念,它是用来量度关键词在网页上出现的总次数与其他文字的比例,一般用百分比表示。相对于页面总字数而言,关键词出现的频率越高,那么关键词密度也就越大。举个例子,如果某个网页共有100个词,而关键词在其中出现5次,则可以说关键词密度为5%。
当然,这个例子只是一种理想的简化方式,它没有有效包括HTML代码里面的诸如<meta>标签中的Title、Keywords、Description,图像元素的Alt文本、注释文本等,这些在计算关键词密度时也都要考虑在内的。同样地,在计算关键词密度时,也不仅仅指网页可见部分中关键词出现的次数,也包括在上文中提到的非可见部分中的出现次数。同时,也要考虑Stop Words(停用词),这些词往往会在很大程度上稀释关键词密度。搜索引擎在算法上要比这复杂得多,但基本策略与此近似。
例如:
1.中文关键词
在中文里,字或者词之间并不存在自然分隔符,而且中文里的词通常由两个或两个以上的中文字符组成。因此,搜索引擎不能借助分隔符对页面正文内容进行分词,而是按照某种算法把页面正文内容划分为若干个中文词汇。
2.中文关键字密度
为了让读者可以更加容易理解中文关键字密度,下面举一个简单的例子进行说明。如网页内容为“我的笔记本”,搜索引擎将其切分为“我”、“的”、“笔记本”,则关键字“笔记本”在这个文档中的密度就是“1/3”。
对于短语关键字,通常通过计算组成短语里的每个词的密度去衡量该短语的密度。例如“智能手机走进大众市场”可以切分为“智能”、“手机”、“走进”、“大众”、“市场”。其中的“智能”及“手机”各出现了一次,则它们的关键字密度都是“1/5”。
3.英文关键词密度
在英文中,同一单词的不同形式会被认为是两个不同的单词(大小写除外)。如battery与其复数形式batteries,会被认为是两个不同的单词。
在英文书面表达里,空格是单词间的自然分隔符,而句点就是一个句子或者段落结束的标记。根据这个特征,搜索引擎就可以轻易地对网页正文内容进行准确的划分。
而对于词组,通常通过计算组成词组的单词的密度去衡量该词组的密度是否合理。
在每个页面确定了自己的关键词之后,需要在页面内容中适当出现这些关键词。关键词密度(Keyword Density)是用来量度关键词在网页上出现的总次数与其他文字的比例,一般用百分比表示。相对于页面总字数而言,关键词出现的频率越高,关键词密度也就越大。关键词密度一般在2%~7%较为合适。不要进行关键词堆砌,即一页中关键词的出现不是根据内容的需要而安排的,而是为了讨好搜索引擎人为堆积关键词(Stuffing)。这已经被搜索引擎归入恶意行为(Spamming),有遭到惩罚的危险。
4.英文SEO的关键词布局
英文SEO关键词布局的基本原则是:无所不在,有所侧重。
页面的正文内容当中必须适当出现关键词,并且“有所侧重”。从上到下——范指用户阅读习惯形成的阅读优先位置;从左至右——成为关键词重点分布位置,包括页面靠顶部、左侧、标题、正文前200字以内,在这些地方出现关键词对排名更有帮助。
要做英文SEO的网站进行域名选择和网页、文件夹命名时,也可以考虑包含关键字,对排名有一定作用。
上述这些就是英文SEO的关键词密度及布局,和中文SEO的关键词密度和布局没太大区别,所以,知道如何做中文SEO的关键词密度及布局,英文SEO是手到擒来的事。
3.4.1 关键词密度控制
一直以来包括百度、谷歌、雅虎等这些搜索引擎都将关键字密度作为其排名算法考虑因素之一,每个搜索引擎都有一套关于关键字密度的不同的数学公式。合理的关键字密度可使你获得较高的排名位置,密度过大,反而会起到相反的效果。
1.首页关键词密度
首先能放关键词的肯定是标题、关键词和描述,其次为显示替换类的,再就是文章内容。更新的文章、图片具体增加关键词的密度有:1显示、2替换、3注释、4文件名称、5子目录名称。
首页密度控制在5%~10%之间,但具体控制在多少需要进一步进行分析。
(1)域名中是否带关键词简写拼音,如果带则可将密度调协得高点。
(2)域名是com的可以多一些,cn的则可少一些。
(3)是老域名还是新域名,刚开始的新域名最好控制在6%比较稳妥,老域名可以适当高点。
(4)关键词的热度,如果关键词很热的话,关键词密度最好低点,当然太低的竞争又上不去,可以先低,等排名上去了再增加关键词密度。
2.栏目关键词密度
栏目关键词的方法基本和首页一样,它与增加关键词密度都是网页技术,不过要注意的是,首页和栏目页所采用的增加关键词密度的方法要有些不相同,这样才不会留下明显的痕迹。栏目页关键词应控制在6%以内。
基于上面的说法,控制栏目关键词密度需要注意的地方如下。
(1)栏目应该是真正的栏目,如栏目是做的“鲜花”的,那么内页也应该是有关鲜花的内容,内页关键词密度控制也应该是鲜花。
(2)栏目既然只是一个栏目,那么该栏目首先要注意的则是栏目方面的关键词,对首页的关键词都可以放置在后面。
(3)栏目关键词应该是和首页关键词相关。
(4)栏目关键词与首页关键词又有不同,因为是用栏目关键词来另外开辟一个排名,如做的是结婚类的网站,如果另外做个栏目叫做鲜花,这样就能在鲜花方面排名,排名显示的肯定是栏目不是顶级域名。
(5)如果网站不建议栏目做排名的话,那么得将所有页面都看作是子页面。
3.子页面关键词密度
理论上子页面关键词密度是可以控制在10%而不被处罚的,但是如果一个网站所有页面都是10%的关键词密度的话,岂不是全站到处都是关键词了,这样的网站会被优化到别人看都不想看的状态。
控制子页面关键词密度要注意以下几点。
(1)必须是平均分配,不要有些6%,而有些只有1%,这样的话,一旦控制不好容易让有些页面超出密度要求。
(2)不能只是网站顶部和顶部来增加密度,必须有30%以上的关键词密度来自于页面的文章内容。
(3)子页面是居于网站之下,栏目之下,所以一定得跟着网站和栏目来设计关键词。
4.关键词密度应该出现些错误化
(1)如做“汽车美容”的网站,栏目是“汽车美容的价格”,子页面的关键词要做的肯定是上面两个关键词,根据百度分词计算方式可以分为“汽车”、“美容”、“价格”、“美容价格”、“汽车价格”、“汽车美容”、“车美容”、“车价格”等,具体分词方式要根据具体词来分,那么子页面可以对上述分词中的关键词分别进行密度增加,而不是单一的增加一个词,这样优化痕迹更不明显。
(2)经常也能出现些错误的关键词如“起车”、“加格”等,因为拼音是一样的,百度能识别,但是错误不会影响你的密度。
(3)当然如果能做10~20个页面,则没有关键词也可以。
3.4.2 关键字密度对网站排名的影响
就实施惩罚所容许的关键字密度的阈值而言,不同的搜索引擎之间也存在不同的容许级别。对过度优化如关键词Spam而言,不同的搜索引擎容忍的阈值也不尽相同,从大到小排列大致依次是Google、MSN,然后是百度、Sogou、IASK、Yahoo!。
1.关键词密度的阈值
什么样的关键词密度为妙呢?关键词密度是一个模糊的概念,没有一个准确的公式来限定其密度。各家搜索引擎的密度值控制都不一样,甚至是同一家的搜索引擎,对不同网站的关键词密度的大小所能允许的容忍阈值也不相同。如同样一个页面,新浪、CCTV的网站密度值达到20%可能就没有什么事情,但如果是你的网站,估计马上就被屏蔽了。这还涉及到了搜索引擎的信任值问题,在此先不作介绍。
关键词密度并不是越高越好。一般来说,在大多数的搜索引擎中,关键词密度在2%~8%是一个较为适当的范围,有利于网站在搜索引擎中排名,同时也不易被搜索引擎视为关键词Spam。笔者认为在百度上的关键字密度对排名较为重要,5%左右的密度应该是比较理想的,但是也根据网站页面的字符数而定,Google的可以更高些。很多相关工具对此都给出了大概的范围,如图3-8所示。
图3-8 站长工具关键词密度查询
2.怎样查询网页关键词密度
在推荐上的“页面关键词密度查询”中可查询网页关键词的密度。
相对百度,Google搜索引擎赋予关键词密度的权重更小了,很多排名靠前的网页关键词密度可能高到20%以上,也可能完全没有关键词。有人曾经专门就这个观点做了一个实践,通过一个布满关键词的页面进行观察,百度更重视的是关键词密度,而Google更为重视的则是外部链接的建立。
3.什么是增加关键词密度的最好方式
毫无疑问,最佳选择的是通过网站本身的内容来做为有效支撑。所以只要按逻辑,按语法正常写你的网页,就不必太顾及关键词的密度。一个页面中出现关键词密度很高的情况,只要是实际需要的,便可以保留,毕竟是给你网站的访问者看的,而不是做给搜索引擎看的,尽量提供最有价值的信息给浏览者才是最重要的,不过需要澄清的是,那样的页面有可能会被搜索引擎自动的过滤掉,因为关键字过多很可能会触发关键字堆砌过滤器(keyword stuffing filter)。
3.4.3 如何布局关键词
要达到理想的网站优化效果,不仅仅要为我们的网站或网页选定恰当的、有效的关键词,更重要的是如何在网页中恰当地将这些关键词嵌入到内容中。
1.关键词的位置
关键词出现在页面文件的哪个部分及先后顺序,对网页出现在SERP中排名的影响较大,如下实例:
<! --页面注解--> <html> <head> <title> 页面标题</title> <meta http-equiv=Content-Language content=zh-cn> <meta http-equiv="Content-Type" content="text/html; charset=gb2312"> <meta name="keywords" content="关键词"> <meta name="description" content="网站描述"> <link href="inc/css.css" _fcksavedurl=""inc/css.css"" _fcksavedurl=""inc/ css.css""type="text/css" rel="stylesheet"> </head> <body> <div> <h1>页面内容标题</h1> <h2>页面相关性标题</h2> <h3>标题系列</h3> <h4>标题系列</h4> <h5>标题系列</h5> <h6>标题系列</h6> <img src="xxx.jpg" alt="图片说明"> <a href="/" title="链接说明">链接词</a> <strong>重点关键词强调</strong> <b>关键词强调</b><u>关键词强调</u><i>关键词强调</i> </div> <div> 版权部分关键词强调 </div> </body> </html>
注:在<body>…</body>标签区中的罗列,都是基础的HTML标签,这些标签出现的次序是可以变化的。
第1行<! --页面注解-->。这个标签是用来做HTML代码注解的,很多站在这里会写上关键词,这种形式的注解在浏览器中是不会显示的,而搜索引擎可以读到。所以这个标签有的时候会成为作弊的一种形式,不要过多的用这种标签来注明你的关键词,否则如果搜索引擎认为你是作弊的话,就惨了。
第4行<title>页面标题</title>。对于做百度SEO的朋友,一定要记得这个标签可能是你是否真正能够做到排名靠前的重点,而且这个重点绝对不容忽视。标题主要注意你的用词,如果你做垃圾站,堆关键词也无所谓;如果你要做正规站点,请你认真对待,写得标准一点,不要堆关键字,保持你的主要词在这里出现3次,太多对你没有好处,对排名也不会有好处。Google并不喜欢太长的标题,百度也偶尔提到只希望在标题的前20个字里出现你的关键词。明确这些以后,还要注意的是,你的主要关键词应该在标题里越靠前越好。
第7行<meta name="keywords" content="关键词">。它的权重越来越低,但是再低都是有权重的,只要认真对待,这里的词是有效果的。这里需要注意以下两点:
大部分人在此处写的关键词不会超过3个,有的人直接只写一个,这是有好处的,每一处标签都有权重,你强调的内容越少,那么它的权重就会越高,所以不要写太多,否则不如不写,而让搜索引擎自己去判断你的页面关键词。
几乎所有的SEO专业人员都会跟你说尽量在每一个页面写不同的关键词,避免被认为是重复页面的危险。
第8行<meta name="description" content="网站描述">。这个主要是为了在搜索结果里出现索引结果,索引结果就是在百度搜索你的网站的时候标题下面的摘要内容。这是一个页面的导读,用来说明网页的主要内容,当然现在的权重不高,跟keywords标签一样,不太受重视。而且现在由于搜索引擎机器人的越来越智能化,基本上已经实现整个页面的摘要内容都能随意出现在它的索引结果里,搜索引擎会根据你搜索的内容不同而显示不同的索引。你如果要写description,就认真去写,很多人是用这里来控制搜索引擎的索引显示的内容,因为网站描述写得越具体,就越有可能在索引的时候出现这个标签中的内容。
第14行<h1>页面内容标题</h1>。这个标签是页面中最重要的标签,也是搜索引擎定位这个页面的主要依据,如果你的<h1>标签里没有出现你的页面关键字,那真是一种很大的损失,这里的权重相对于其他的在<body>区的标签来说更加重要。在HTML代码中,它的重要性仅次于<title>。很多人放弃写这个标签,这对于搜索引擎是很不友好的。这里可以不出现其他强调关键词的标签,但是这个标签一定要出现,这是告诉搜索引擎你的页面用一句话应该如何表达,如果这一行一个字都没有,再智能化的机器人可能都会以你的<title> 来决定是否用其作为一个词的排名,因为他们程序的原因,很多时候一个网站的页面标题都是完全一样的。如果你没有办法修改title,已经损失很大了,而如果你的页面中的<h1>标签也没有出现的话,那么搜索引擎要怎样去理解这个页面呢?这对于SEO来说,是一件很糟糕的事情。所以,认真对待页面中的<h1>标签。需要注意的是,这个标签在同一个页面不要出现太多,道理很简单,太多会让别人无法确定你页面中哪一个才是最重要的,无法确定重点跟没有这个标签没有太大的分别。所以,最好只出现1次,以达到明确说明的目的。
第15行<h2>页面相关性标题</h2>。这个标签与<h1>是一样的,但是权重相对来说较低,如果你的页面没有<h1>,那么这个标签对于页面来说基本上就相当于<h1>的重要性了。这里面你包含的是长尾关键词相关的内容,如你的页面做几个关键词,主词应该出现在<h1>里,那么其他的词以及你想发展的词就可以出现在<h2>里,这样来说是一种合理的安排。而<h3>~<h6>标签,其重要性是依次递减的,在页面中的权重越来越低。
第20行<img src="xxx.jpg" alt="图片说明">。我想这个标签很多人都知道,它的作用很明确,不是指定一张图片的说明文字,让搜索引擎知道这张图片是关于什么的。如你的图片是"刘亦菲",那么你的alt="图片说明"中的"图片说明"就应该是与"刘亦菲"相关的词或者句子。这样写当然也有利于你在图片搜索的结果里显示排名更前面一点,不过现在百度基本上是以页面标题作为一张图片排名的要素,当然,你的alt标记做得好,将会增加你的图片匹配度。
第21行<a href="/" _fcksavedurl=""/""_fcksavedurl=""/"" title="链接说明">链接词</a>。这是链接说明,同时也是一个页面链接的SEO重点,这里的“链接词”相当的重要,如果你跟别人交换链接,你这个词的写法是起着外链好坏与否的决定性因素的。“链接词”建议最好写成自己的关键词,如果觉得实在不行,则一定要在“链接说明”里出现你的关键词。否则对于排名,你的链接做得没有太大的好处。这在SEO专业术语里还有一种叫法,叫做“Google炸弹”,就是用很多站点,同时链接到一个网站,然后所有的“链接词”都写一个词“刘德华”,不久以后Google就会将这个站当做“刘德华”这个词最权威的站点,即使被那些站点链接的这个页面没有任何与“刘德华”相关的内容,这个网站在“刘德华”这个词的排名情况也会很好。不过google已经调整了算法,但是这样做链接肯定是有用的,一定要认真对待你的链接。还有一个重点,就是对方的链接,如果是JS调用的,你就别想在他那里得到任何权重,因为搜索引擎不会去读取JS里的内容,所以,建议大家好好做链接,不要你的站做了链接却跟没做一样。像百度空间的友情链接就是JS文件调用的,所以百度空间里的友情链接你是没有权重的。具体可以查看HTML代码,正常情况下,在一个页面中的<a>...</a>标签内找不到你的网站地址,基本上这就是属于无效链接。
第22行<strong>重点关键词强调</strong>。这个标签的重要性仅次于<h1>,它比<b>、<u>、<i>等标签要权重高。所以如果你的页面有很重要的词,而你想强调它,则首先选这个<strong>标签,接下来相对不重要的词则可选<b>、<u>、<i>等标签。当然,不要用得太多了,用得太多没有重点就等于没有用了。
第26行版权部分关键词强调。这个权重越来越高了,在底部版权部分,很接近版权部分出现的关键词,是一种SEO策划的手法。在这里强调关键词,是让关键词布局更加合理,而不是头部出现关键词,中部强调很多次,而底部却什么也没有关联。
2.关键词密度或关键词频率
在网页中关键词出现的频率越高,搜索引擎便会认为该网页内容与相应关键词的相关性更高,从而更易出现在SERP的前端。
3.关键词URL对应表
关键词分组完成后,建议SEO工作人员将关键词搜索次数,目标URL等情况列表,如表3-1所示。
表3-1 关键词URL统计列表