北京网站优化 北京网站推广 北京网站建设 北京网页设计 北京SEO

提供优质的优化服务,热门词优化,SEO培训,整站优化,站群优化 010-86983211

« 企业网站有效利用率非常低什么是Google补充材料? »

搜索引擎的分类

搜索引擎的分类
搜索引擎并没有一个精确的定义,大致可以分为两大类:全文搜索引擎(FullText Search Engine)和分类目录(Directory)。
全文搜索引擎通过一个叫网络机器人(Spider)或叫网络蜘蛛(crawlers)的软件,自动分析网络上的各种链接并获取网页信息内容,按规则加以分析整理,记入数据库。Google、百度就是比较典型的全文搜索引擎系统。
  分类目录则是通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。
  全文搜索引擎的使用以关键词和一定的语法为特点,而分类目录则通过建立多级目录对网站进行分类。它们在使用上各有长短。全文搜索引擎因为依靠网络机器人搜集数据,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确;分类目录依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。  
此外,基于这两类搜索引擎,还衍生了其它的搜索服务,主要有所谓元搜索引擎(META Search Engine)。和集成搜索引擎(All-in-One Search Page)等,就不一一介绍了。
搜索引擎既然没有明确的定义,一般就以其发展中一些里程碑式的应用标志其阶段。北京google左侧排名优化业界普遍的共识是“第一代搜索引擎”是依靠于人工分拣的分类目录搜索,以"雅虎"为标志;而"第二代搜索引擎"则是依靠于机器抓取,并建立在超链分析技术基础之上的网页搜索,以"Google"为代表,其信息量大、更新及时、但返回信息过多,可能有很多无关信息。而"第三代搜索引擎"则把"智能化"、"人机交互"等功能融入了主流。将自动分类技术、中文内容分析技术及区域识别技术应用到大型搜索引擎中,除了在信息检索速度、更新频率等基本技术指标方面处于领先地位外,它的网页相关检索、拼音纠错、模糊查询、口音查询技术也具有很高的水准。此外,还同时兼备了新闻、MP3、图片、FLASH搜索功能,已成为能够提供全面、综合的信息搜索服务。
这里介绍的是在国内外影响比较大的主要的一些搜索引擎和分类目录站点,
  1、Google(http://www.google.com/)
  2、百度(http://www.baidu.com/)。
  3、中国搜索(http://www.zhongsou.com/)。
  4、搜狗(http://www.sogou.com)
  5、雅虎一搜(http://cn.yahoo.com/)。
  6、新浪查博士(http://cha.sina.com.cn/)。
  7.搜索引擎的基本原理
  全文搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 “网络机器人”或“网络蜘蛛”是一种网络上的软件,它遍历Web空间,能够扫描一定IP地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。它为保证采集的资料最新,还会回访已抓取过的网页。网络机器人或网络蜘蛛采集的网页,还要有其它程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,才能添加到索引数据库中。我们平时看到的全文搜索引擎,实际上只是一个搜索引擎系统的检索界面,当你输入关键词进行查询时,搜索引擎会从庞大的数据库中找到符合该关键词的所有相关网页的索引,并按一定的排名规则呈现给我们。不同的搜索引擎,网页索引数据库不同,排名规则也不尽相同,所以,当我们以同一关键词用不同的搜索引擎查询时,搜索结果也就不尽相同。
  大型全文搜索引擎的数据库储存了互联网上几亿至几十亿的网页索引,数据量达到几千G甚至几万G。但即使最大的搜索引擎建立超过二十亿网页的索引数据库,也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的内容。而互联网上有更大量的内容,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。
  和全文搜索引擎一样,分类目录的整个工作过程也同样分为收集信息、分析信息和查询信息三部分,只不过分类目录的收集、分析信息两部分主要依靠人工完成。分类目录一般都有专门的编辑人员,负责收集网站的信息。随着收录站点的增多,现在一般都是由站点管理者递交自己的网站信息给分类目录,然后由分类目录的编辑人员审核递交的网站,以决定是否收录该站点。如果该站点审核通过,分类目录的编辑人员还需要分析该站点的内容,并将该站点放在相应的类别和目录中。所有这些收录的站点同样被存放在一个“索引数据库”中。用户在查询信息时,可以选择按照关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟全文搜索引擎一样,也是根据信息关联程度排列网站。需要注意的是,分类目录的关键词查询只能在网站的名称、网址、简介等内容中进行,它的查询结果也只是被收录网站首页的URL地址,而不是具体的页面。分类目录就像一个电话号码薄一样,按照各个网站的性质,把其网址分门别类排在一起,大类下面套着小类,一直到各个网站的详细地址,一般还会提供各个网站的内容简介,用户不使用关键词也可进行查询,只要找到相关目录,就完全可以找到相关的网站(注意:是相关的网站,而不是这个网站上某个网页的内容,某一目录中网站的排名一般是按照标题字母的先后顺序或者收录的时间顺序决定的)。
  由此可见,分类目录引擎的收集信息、分析信息和查询信息方式是非常类似于当前黄页网站分类查询体系,不同的是黄页收集信息主要来自电信渠道,普通的分类目录引擎一般都是由站点管理者递交自己的网站信息给分类目录,然后由分类目录的编辑人员审核递交的网站,以决定是否收录该站点。搜索引擎的出现很大程度上改变了人们对信息的使用习惯,提高了信息的使用效能,它发轫于因特网,但现在已经渗透到了各个行业,了解搜索引擎,研究搜索引擎,应用搜索引擎,具有广阔的发展空间。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

日历

最新评论及回复

最近发表

版权所有北京google排名

Copyright 2005-2007 www.73218.com . All Rights Reserved.