我们先来聊下搜索引擎研究,搜索引擎研究算法的文章我想大家也都在网上或者其它地方看过不少吧,我个人觉得那些深层次的就不用去研究了,毕竟我们不是专业做搜索引擎的,呵呵。下面就搜索引擎算法我谈一些个人认识。
搜索引擎最主要的解决问题在于,如何有效快速地抓取互联网的信息而不被无休止的重复链接,错误链接,及循环程序所困挠,并分类有序地存储入库。其次,就是要符合用户体,给搜索用户带来亲密感。反制垃圾SEO的干扰,就是搜索引擎最头痛的问题所在。
如果大家只是做一个关键词排名,抓取程序大可不必深究,因为以目前搜索引擎强大的索引能力,让搜索引擎索引一个新站,那可是轻而易举的事情。搜索引擎基本上是按照域名的重要性决定收录网页数量,百度的算法和GOOGLE的有些区别,百度在收录网页数量不足的情况下将会非常努力的遍历网站的链接更深处,但GOOGLE对于动态网站则只会遍历一定的链接层次,这个层次是多少,网上有很多种说法。所以需要我们制作网站地图。
对于搜索引擎反作弊的手段,SEO也必须多多少少心里有杆秤吧,其实所有的SEO都是在人工干涉排名的。我们可以假设一下,如果没有seo干涉,一个竞争激烈的关键词排名会是怎么样的呢?
第一、他的相关性肯定非常强;第二、内容丰富,更新平凡;第三、非常有权威。
但是如果加入seo元素就变了,那就是:关键词密度、内部结构等因数都要非常合适,几乎所有页均被搜索引擎收录,反向连接非常丰富,并确是非常自然的连接,连接种类也很多。
以上就可以看出我们做seo的工作重点在哪里了,那就是,使网站的关键词突出,内容丰富,使网站结构合理,层次经可能的少些,拥有大量的反向连接并确尽可能的广泛分布。
下面我们来讲解关键词。
关键词包括:关键词的位置,关键词的密度,标签对关键词的作用。
在seo文章中对关键词的位置和密度讲解的最多,这里我就不详细讲解了。主要是《title》《alt》之类的标签,文章的开头、段落的开头都要用到此类,其中《title》中和超链接中的文字对提升关键词的相关性尤为重要。搜索对于关键词的密度要求其实很松的,并不是某些人说的百分之五,或是百分之二十以内,只要不是恶意重复,自然一点就OK。诸如加粗加大的特殊标签,对加强一篇文档与被着重的关键词相关性,作用也很明显。但是在需要优化的关键词数量非常多的情况下,如何控制好特殊标签,从而使多篇文档融合为一个有机互益的整体,就非常值得研究一下了。至于《h1》,《h2》,《h3》和《strong》标签,下面我会说到。
但是过份的使用标签,那就是关键词作弊了。那样搜索引擎就会K你了,呵呵。
讲关键词必然会谈到链接,链接是一个网站在搜索引擎中表现的筹码。在搜索引擎的搜索结果中存在着不相关内容会影响搜索引擎的功能性,而不按重要性无序排列的结果,将带给用户极坏的用户体验。
然而在搜索引擎算法中,重要性是如何体现的呢?显然,只有链接。这里我们说的链接指的是外部链接。互联网是靠超链接互相联系起来的,不管是百度的链接分析算法,还是GOOGLE的PR算法,他们始终是围绕以下几点:1.链接的数量;2.链接的质量;3.链接的来源;4.链接文本;5.SPAN链接。
链接的数量,这个大家都很容易理解,我不必多说了。
链接的质量,网络上有很多种说法,各搜索引擎角度也不一。GOOGLE的高质量链接是以给出链接的这个页面在搜索引擎中的重要性较高。如果一个权重高的站给你做了链接,这个时候这个链接就是一个很高质量的连接,而百度更加看重首页链接。对百度而言,内页的连接质量永远比首页要低。当然,网站权重的高低也是一方面的。
这里我要重点想说的是SPAN链接。我想大家对SPAN链接应该都很熟悉吧,总结来说,SPAN链接是指用链接进行作弊,手段主要有,留言本span,BLOG span,Wiki span,以及Link Factory(连接工厂)。各搜索引擎之间差异最大的可能就是针对span的解决部分了,GOOGLE对于留言本群发之类的SPAN采用补充材料降权、不作处理的方式处理SPAN,对于Link Factory采用彻底封杀处理,这样也导致一些网址导航站被无故封杀,这也是搜索机制存在的问题。
百度我们都很了解,称为本土化的搜索引擎。我们谈到百度最多的也就是百度的人工干涉。百度封杀SPAN可能采用程序和人工干涉相结果的办法。先通过机制算法将问题连接页面添加到数据库,再由工作人员人工审核。从某种意义上来说,链接的来源和链接文本属于相关性研究的范畴。链接作弊和关键字作弊属于搜索引擎反作弊算法研究范畴。他们都可以算做是链接质量的一部分。
下面我们来分析不同搜索引擎的细微区别。
在一个网站的SEO过程中,最好是要兼顾多数搜索引擎的习惯。但在某些竟争力相当大的关键词SEO中,有针对性的SEO行为也是非常有意义的。所以研究分析不同搜索引擎之间的区别,也是很有必要的。这里我们就对百度,GOOGLE,YAHOO之间区别进行说明。百度是中文用户市场份额最大的一个,但是百度的竟价排名,使大多数SEO都不注重百度的SEO,我想大家也是这样的吧。GOOGLE是SEO们奋斗的焦点,而YAHOO最近一段时间则默默无闻,由于YAHOO和GOOGLE的相似程度比较高,所以GOOGLE SEOER们喜欢YAHOO,也比喜欢百度多一些。GOOGLE和YAHOO的区别在与,Google注重语义分析和链接,Yahoo注重title和外部链接。Google和Yahoo更新很快,蜘蛛很勤劳,由于只要把页面本身优化好,就能在Yahoo中取得很好的排名,而这些页面优化都是自己可以控制的,所以说Yahoo优化比Google优化更容易,所用时间更短。
特别是对于热门关键词,两者的区别非常明显。从另一个角度来说,能把Google优化好的人不一定水平有多高,可能只不过是手头有较多的链接资源可以利用,要是服务期过了,把指向你的链接一撤,你的排名就会掉下来。但是你能把Yahoo优化好,说明你的网页优化本身是好的,你的排名基础是扎实的,你的优化工作做的很到位、很牛、很好很强大。特别强调一下Google的强大的语义分析能力,很多人说搜索引擎看不懂语义,这其实是错的。我们做连接时,将关键词和谐的组织到一个语句里,再进行关键词连接优化,这样的效果远远高于你单做一个词的效果。在Google中搜“seo入门”, 结果你会发现“seo基础”的网页,这些网页针对“seo基础”作了很好的优化,但是并没有出现一处“入门”。可见Google把“入门”和“基础”看成极为接近的词。
Google的PR和百度的超链分析。
网络上对这一分析很多,其中最重要的两句是:
“超链分析要解决的是文件与搜索关键词的相关性。李彦宏提出的方法是,除了文件本身对关键词的引用外,还需要考虑反向链接中的关键词。”
“在Google的专利申请中,明确提到即使在考虑了指向文件的链接及链接锚文字之后,搜索引擎还有重要问题需要解决,那就是来自不同文件的链接有不同的权重值。”
我个人总结了一下,在关键词分析方面,所有搜索都对标签有所分析,但YAHOO的比重大些,GOOGLE还会分析语义及反向链接的质量及相关性。BAIDU的所谓中文分词算法也只是对中文词语的逻辑性分析比较强,语义分析没怎么样。这三大搜索引擎只有GOOGLE对META标签还是有所看重,description中的关键词仍被加红显示,GOOGLE对所谓的标准站点比较看重。可以看到,反向链接质量和数量较低的网站来自百度和GOOGLE的流量天差地别。而YAHOO关键词排名对首页比较看重,内页关键词不容易被深挖。GOOGLE对反向链接质量区别很严,非常看重来自页面等级高的链接,而百度看似对首页链接更喜欢一些。
短时间的大量群发链接,会导致网站在GOOGLE中进沙盒,但从沙盒出来以后链接仍有效果,不知道大家的站有没有进过沙盒。而YAHOO效果则很明显。但当一段时间链接不再增加以后,排名下降也会很快,YAHOO非常看重时效性。百度反作弊算法则认为群发链接是作弊,递交人工审查后,垃圾站立马被封。如果你站美工好点,或者是商业站点,或许会幸运一点,要么首页被封,要么撒事没有。
这个我做过很多实验,垃圾站100%被封。对于反作弊,YAHOO以前显然很不到位,但是现在弄出一个有奖搜虫计划,对于链接工厂,K的比百度GOOGLE还要严重。GOOGLE有着一套对首页和内页明显不同的检查标准,想作弊不被K,请用内页优化,呵呵。
接着给大家讲讲拆分式优化。
字面上大家可以看的出来,拆分也就是说把你所需要优化的关键词进行拆开,分解成一些比较常规的词语、字或者短语。这样做的用途是减轻主关键词的竞争压力、利用分解词语推动主关键词的排名提升。
年前我做了个站:上海机票 www.521yy.com 机票这样的词,看都不用看就知道竞争是很激烈的,如果按照常规的优化方法去做难度是很大的,而且 www.521yy.com 的域名质量及权重都不是很高,所以我改用了分解关键词的优化方式,首先将关键词“飞机票”拆分成“飞、飞机、机票、票”这4个常规词,添加了大量与这4个词有关的新闻及文章,在文章中“飞、飞机、机票、票”都以加粗处理 并在文章中用到《h1》,《h2》,《h3》和《strong》标签,通过这些拆分后的关键词进行辅助优化后,效果就很不错。
分解优化需要涉及到《h1》,《h2》,《h3》和《strong》的用法,特别是博客。为什么呢?因为有些很好的博客已经做了很好的SEO,只要稍作优化,加强连接及连接广泛度就能取得很好的成绩。大家都知道这几个标签对于搜索引擎来说有比较重要的作用,在里面适当的放上关键词有利于排名,但是标签的位置和标签的使用度一定要把握,不然也会被搜索引擎认为是作弊而打入沙盒或者直接K掉。
大家都知道,SEO的一个很重要的一点就是要把网站做的条理清晰,让搜索引擎很容易的读明白,让蜘蛛爬行通畅,这个条理清晰不仅体现在网站的物理路径、URL等地方,在《h1》《h2》《h3》等方面也是这样。并不是《h1》对于关键字排名有帮助,如果在任何有关键词出现的地方我们都用《h1》的话,这样可能会被惩罚或者被搜素引擎降低你《h1》的权重而无法体现关键词的重要性。《h1》《h2》《h3》需要层层递进,依次类推主导词,使得搜索引擎给予《h1》以很高的权重。
《h1》通常用于网站最重要的标题,所以在标题里面放上你网站的关键词是很明智的做法。一个网站不仅仅只有一个页面,还有很多栏目,栏目里面又还有子栏目,所以《h2》《h3》则分别用以类列表,内容标题列表,这样网站标题-栏目标题-子栏目标题-内容列表标题的关系层层递进,思路清晰,搜索引擎就很容易分辨你网站的那个地方重要,哪个地方是次重要。我认为,《strong》就没有像《h1》《h2》《h3》这样这么严格,在适当的位置都可以用此标签来重点突出关键词。
总的来说,这2种类型标签相辅相成,要灵活的配合使用,会使你的网站层次分明,重点突出。对于标签的使用我觉得大家应该多去google管理员博客看看,因为搜索引擎是不断更新变化的,所以了解到最新的动态才能取得好的成绩。只有你让搜索引擎更轻松的阅读你的网站,对于你重点体现的地方它就更容易读出来,当然在排名上也就赋予了你更高的权重。层层递进,以次推主。
最后我再对seo一些常见现象做一个说明。
1.提交网站至相关目录
这几乎是所有需要搜索引擎的站长都建议的方法,不过我好久不用了,因为效率极低。
2.网站内部结构优化,页面静态化
这种做法是非常有效且必要的,也是“讲道德的”SEO所做的最重要的核心工作,属于正常优化。也是我们所说的白帽优化。
3.关键字密度
搜索引擎早期最原期的作弊手法之一。不过现在搜索引擎几乎不再惩罚了,但这种作弊起不到什么效果。只有在碰巧的情况下,会有个把关键词排名还不错。想要稳步提升关键词排名,靠它几乎是没什么门了。
4.隐藏文字连接
隐藏文字连接和跳转是GOOGLE最反感的作弊方式之一,多用于消除FLASH页面不利于优化的缺点,其实只需要把页面结构美化一下,这种风险实在是没有必要冒。
5.页面跳转
和隐藏文字一样,属于没有必要的风险,一般SEO也不太愿意做这种事,多数是被客户或是现实逼迫的。
6.链接工厂
当前最最流行的作弊方式之一,但是由于网络情况的复杂,大量网址站的存在,BLOG友情链接推荐等等和它相似但不属于作弊情况的存在,使搜索引擎始终没有办法彻底清除。它对关键词排名效果是最最明显的,一旦被发现,将是致命的打击。
7.信息群发
和链接工厂一样,以前对于搜索引擎来说信息群发并不是作弊。GOOGLE对留言本采取宽容的态度,只是降低留言本链接的权值,并不加以惩罚。但以人工编辑为主的百度来讲,这是一种绝对不能容忍的行为。这也是许多网站在GOOGLE中排名很好,但却被百度拒绝收录的主要原因之一。