百度搜索引擎的收录习性

以下,也不知道是猴年马月的文章,觉得不错,并依然具有参考借鉴的作用,于是稍稍润色,放在这里。全文如下:

首先我们可以回顾一下搜索引擎百度使用的技术。搜索引擎百度的技术有三点。如下。

一、一种互联网上镜像和准镜像网站的识别方法。这个方法解决了搜索引擎对雷同信息的重复获取,节省网络资源和本地资源、提高系统服务的质量和效率。

二、一种基于词汇的计算机索引和检索方法。对一段连续的文字信息,在经过词汇分析处理后,通过添加隐形词汇的手段,实现对基于词汇索引和检索系统的检索质量提升,使用户获得更加准确的检索结果。

三、一种使用快照的方式实现对网上信息进行记录和分析的方法。该方法是通过对互联网上一个特定信息,多次进行快照的方式,将信息当时的状态进行保留。并通过对一系列快照信息的分析,得到有效数据,方便地得到网上信息的变动情况。

百度既然是全球最大的中文搜索引擎,对中文网页的搜索技术在某种程度上领先Google自然是理所当然的。但是,百度与Google除了存在着某些方面的相同或相似之外,却又有着自己独特的特点。如:

百度比较重视第一印象

网站给百度的第一印象比较重要,相对Google,百度搜索引擎的人为参与度较高,也就是说:在某些层面上可能由人来决定是否收录网页,而不是由机器来决定。所以,网站在登录百度搜索引擎之前,最好把内容做得丰富一点,原创内容多一点,网页关键词与内容的相关度高一点,这样才能给百度较好的初次印象。

百度对网页的更新较敏感

百度对网页的更新,相对Google而言更加敏感,可能这与百度的本土性格有关。百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间。所以,在百度的搜索结果中基本上都标明了收录时间。

百度重视首页
   
百度对首页的重视程度要比Google高得多,这与上面提到的“较重视第一次收录印象”一脉相承。百度在显示搜索结果时也常常把网站首页显示出来,但不具体到某个内容页(当其认为不够重要时),相对来说,这在给“用户的体验”上打了折扣,但增加了“百度快照”的用户量。

百度更重视绝对地址的链接

百度在收录网页时,比较重视绝对地址的收录。百度提供的网页快照功能,也没有解析相对地址的绝对路径,不知这是百度技术的疏忽还是其偏好的一大体现。

百度很重视收录日期
     
百度对网页的收录日期非常看重,也是其搜索结果排名的参考点。被百度收录得越早,排名会较高,百度有时甚至会不考虑相关性地把它认为比较重要的内容放在首位,而当浏览者点击进入后,才会发现这些是早已过时的信息,或者甚至是垃圾信息,这是百度需要改进的技术。

 

搜索引擎优化小组(http://www.googleseo.net.cn
本文根据网络文章整合,作者、来源不详。

[搜索引擎百度的网站收录、清除规则]

  • 相关文章:

日历

最新评论及回复

最近发表

Powered By Z-Blog 1.8 Arwen Build 90619 Theme by toboku

Copyright 搜索引擎优化小组 Rights Reserved. 提供:网站营运_网站优化服务 [银泓电子商务营销导向机构] 电话:021-5169 5729