北京网站优化 北京网站推广 北京网站建设 北京网页设计 北京SEO

提供优质的优化服务,热门词优化,SEO培训,整站优化,站群优化 010-86983211

« 搜索引擎的英文词干提取技术-英文网站优化标杆网站分析 »

搜索引擎的体系结构及Google工作原理

本文为北京GOOGLE优化提供,转载请注明链接!

    Google是现代搜索引擎的代表,我们以Google为例,介绍搜索引擎的体系结构及工作原理。

搜索引擎主要由搜索器、索引器、检索器和用户接口组成。

搜索器(Spider)俗称网络蜘蛛或网络爬虫,是一个自动收集网页的系统程序,其功能是不分昼夜地在互联网中漫游,搜索信息;索引器是理解搜索器所搜索的信息,由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息,根据一定的相关度算法进行大量复杂运算,得到每一个网页针对页面内容及超链接中每一个关键词的相关度,然后用这些相关信息建立网页索引数据库;检索器是根据用户的查询在索引库中快速捡出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制;用户接口的作用是输入用户查询,显示查询结果,提供用户相关性反馈机制。

Google的工作原理可分为3步:从互联网上抓取网页、建立索引数据库、在索引数据库中搜索排序。

从互联网上抓取网页,称为网页收集,就是利用能够从互联网上自动收集页面的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其他网页,重复这过程,并把爬过的所有网页收集回来。

建立索引数据库,称为网页处理。就是由分析索引系统程序对收集回来的网页进行分析,提取网页相关信息,根据一定的相关度算法进行大量复杂运算,得到每一个网页针对页面内容中以及超链接中每一个关键词的相关度,然后利用这些相关信息建立网页索引数据库。

在索引数据库中搜索排序,就是当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关页面。因为所有相关页面针对该关键词的相关度早已算好,所以只需要按照现成的相关度数值排序,相关度越高,网站排名越靠前。

为了完成查询服务,需要有相应的元素来进行表达,这些元素主要有:原始网页文档、URL和标题、编号、所含的重要关键词的集合以及它们在文档中出现的位置信息,以及其他一些指标,如重要程度、分类代码等。

最后,有页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

了解了Google的工作原理后,我们很容易理解我们进行网站优化的主要工作,那就是让网页能被搜索引擎有效收录,并提高页面内容的相关度,这样才能获得良好的Google排名效果。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

日历

最新评论及回复

最近发表

版权所有北京google排名

Copyright 2005-2007 www.73218.com . All Rights Reserved.