Google官方:Google搜索工作原理
当您坐在计算机前进行Google搜索时,来自整个网络的一系列搜索结果几乎在一瞬间便呈现在了您的眼前。Google是如何查找与您的查询匹配的网页的,又是如何确定搜索结果的排列顺序的?
简单来说,您可以将在网络上进行搜索想象成在一本大书中进行查阅,书中海量的索引会告诉您各种内容所在的具体位置。您执行Google搜索时,我们的程序会检索索引来确定要返回(提供)给您的最相关的搜索结果。
向您提供搜索结果的三个主要过程如下所示:
抓取:Google 是否了解您的网站?我们能否找到?
编入索引:Google 是否能将您的网站编入索引?
提供结果:您的网站是否包含精彩、实用且与用户搜索相关的内容?
抓取
抓取是指Googlebot找出要添加到Google索引中的新网页和更新过的网页的过程。
我们使用大量计算机来提取(或“抓取”)网络上的海量网页。执行抓取任务的程序叫做Googlebot(也被称为漫游器或“蜘蛛”程序)。Googlebot使用算法来进行抓取:计算机程序会确定要抓取的网站、抓取频率以及从每个网站中抓取的网页数量。
Google首先会以一份网页网址列表开始其抓取过程,该列表是在之前进行的抓取过程中形成的,且随着网站站长所提供的站点地图数据的增多而不断扩大。Googlebot在访问每个网站时,会检测每个网页上的链接,并将这些链接添加到它要抓取的网页列表中。新建立的网站、对现有网站所进行的更改以及无效链接都会被记录下来,并用于更新Google索引。
Google不会通过收取费用来提高某个网站的抓取频率。我们会对搜索业务和以盈利为目的的AdWords服务加以区分。
编入索引
Googlebot会处理所抓取的每个网页,将其找到的所有字词和这些字词在每个网页上的位置汇编成一个包含海量内容的索引。此外,我们还会处理关键内容标记和属性中的信息,例如Title标记和Alt属性。Googlebot可处理多种类型的内容,但并不是所有类型的内容都能处理。例如,我们无法处理某些富媒体文件或动态网页的内容。
提供结果
用户输入查询时,我们的计算机会搜索索引以查找匹配的网页,并返回我们认为与用户搜索最为相关的结果。相关性是由200多个因素决定的,其中一个就是特定网页的PageRank。PageRank 是根据来自其他网页的链接衡量出的网页重要性。简单来说,其他网站中指向您网站网页的各个链接提升了您网站的PageRank。并非所有链接都具有同样的价值:Google致力于通过识别垃圾链接和其他会对搜索结果造成负面影响的行为来不断改善用户体验。根据您内容的质量所指定的链接是最好的链接。
要让您的网站在搜索结果页中排名靠前,您一定要确保Google能够正确地抓取您的网站并将其编入索引。我们的网站站长指南中列出了一些最佳做法,可帮助您避免常见的潜在问题并提高网站排名。
Google的您是不是要找功能和Google自动填充功能旨在通过显示相关的搜索字词、常见的拼写错误和热门查询来帮助用户节省时间。与我们的google.com搜索结果相似,这些功能所使用的关键字会由我们的网页抓取工具和搜索算法自动生成。只有在我们认为联想查询可以节省用户时间的情况下,才会显示这些内容。如果某个网站在某一关键字搜索中获得较高的排名,那是因为,我们已通过算法确定其内容与用户查询的相关程度较高。
转载请注明: 爱推站 » Google官方:Google搜索工作原理
评论列表(0)
发表评论