之前,你可以了解如何谷歌工程,你或许应该有一个基本的想法如何上网工程。 当你访问一个网站,你的浏览器实际上是接触网络服务器,计算机,其任务是提供网页等。 所以当你点击一个链接,你的浏览器中的接触,服务器和说, "送我此页" 该服务器的请求,然后发送页面浏览器,它显示在您的计算机上。
公告
服务器计算机,其任务是履行一个专门工作和提供信息。 举例来说, aweb服务器提供了市场上的网站,而邮件服务器发送或接收电子邮件。
好吧,你现在有这个基本的背景下,让我们来看看如何谷歌工程。
|
|
在一些很基本的方式,谷歌工程就像其它的搜索引擎。 它的基本操作是完全一样的。 象所有的搜索引擎,谷歌组成,由三部分组成:
一只蜘蛛,也称为履带这蜘蛛"抓取"网页和认定内容的网页。
一个索引这一软件需要的所有资料蜘蛛给它,并创造了一个巨大的索引,可以检索。
查询引擎,这是需要你的搜索要求,把它送到了索引,并报告结果给你。
公告
搜索引擎网站,让您在搜索引擎网站。
蜘蛛的一部分,该谷歌搜索引擎是一种自动化的软件,也可以叫做机器人,即要求很多好几千页,从数以百计的网站上同时进行。 当病毒发现链接页,因此,这些项目,并请那些为良好。
主要谷歌蜘蛛是googlebot的,它本质上抓取网站每月一次。 显然,许多网站变化多,每月一次,所以谷歌也有履带式命名freshbot即抓取页面不断。
蜘蛛发送信息的每一页,他们寻找到索引部分的搜索引擎。 该索引那么漂亮惊人jobit创建一个指标的每一个字每一页发送给它由谷歌蜘蛛。 它不只是指数的每一句话和每一个网址,而且还留存纪录那里的每一个字,是对每一页。
多份副本,这个指数是保持对各种谷歌服务器。 一台服务器上,将无法与时并进所有的搜索请求都做了。
唯一的一部分谷歌你看到的是查询引擎,而你看到的只是一部分。 它的市民面对googlethat邀请的搜索框,在顶部的谷歌页。
当你输入一个搜索来说,谷歌网络服务器发送你的请求转交索引,这是居住在多个索引服务器。 该指数伺服器期待透过指数,并配合他们看到的与你的要求。 索引服务器,然后发送信息,文件服务器,其中取出正确的信息和格式,它使你的浏览器是可以理解的。 这格式化资料,然后发送到你的浏览器。
这一切发生在几分之一秒。
这一切搜索引擎的逻辑是什么新的或革命性的转变。 这项技术已经多年,早谷歌是一线希望,在其创始眼睛是雪亮的。
那么为什么这样谷歌是如此地好,但确实吗?
谷歌用途更好的算法比其他任何搜索引擎,并不断精益求精。 算法是套规则,为执行一项特殊的任务。 在谷歌的情况下,其算法是负责为你的搜索请求,并决定采用何种结果,以示你。
公告
算法的一套规则,为执行一项任务。 在谷歌的情况下,算法是什么因素决定哪些网页,它说,配合你的搜索请求。
谷歌的算法并不特别容易,只是凡人了解,他们就会改变一切的时候,他们不会公开。 谷歌利用100多因素,在其算法。 为每一个搜索,你做的,它考虑了所有这些因素,然后计算出得分为每一个可能的匹配网页。 页面与全场得分最高的是第一项搜索结果。 页与第二最高分数是第二个搜索结果,等等。
部分的度量都是相当obviousthe搜索长远需要出现一个网页,举例来说。 谷歌的算法也因子在多少次中期出现一个网页,无论一词似乎是一个突出的一个部分页,有否出现在标题中的一个网页,和许多其他的因素。
这一切都不是特别革命的,要么。 许多搜索引擎做同样的事。
谷歌的真正辉煌是在利用集体的智慧,在网上以计算出哪些是真正相关的,而不是仅仅依靠这种规则。 谷歌还给出了大量的重量,以数量和种页面链接到某一网页。 举例来说,谷歌数字说,如果一个网页,有很多网站连接到它,赔率都是非常好的说,页是一个重要问题。 如果重要的地点,连接这一页,它的更重要。
所以谷歌计算出一个页面级的每一页,那一页秩成为一个非常重要的部分计算。 例如,你做的一个搜索,并谷歌寻找到你的搜索,任期5倍,对一个网页而几乎没有任何页面链接,但3倍于一个页面(如对纽约时报网站)表示,有很多网站连接到它。 更重要的一页(纽约时报页) ,似乎更高于搜索结果列表中,即使搜索来说,似乎就它不那么频繁。
|
|