Google搜索引擎的工作原理

[复制链接]
562 0 打印 上一主题 下一主题
PPCblog.com 展示了 Google 搜索按钮背后的搜索引擎 Jess Bachman(WallStats.com)精心制作的图表,该按钮每天在不到一秒的时间内获得 3 亿次点击。在响应时间内进行的处理。此流程图显示了在您单击 Google 搜索按钮后,Google 如何在眨眼间处理您的搜索请求,然后 Google 返回搜索结果。这就是搜索巨头谷歌年利润高达200亿美元的杀机应用,也是互联网的主要商业和技术神话,想必大家都想知道谷歌这头钱牛背后的秘密。
谷歌对其搜索技术的官方描述

我们搜索技术的后端软件会在服务器上触发一系列并行计算,运行时间不到 1 秒。我们使用了 200 多个指标信号(包括我们专利的 PageRank 页面排名率)来检查 Global Network 的链接结构(Page 和 Brin 最初的想法是使用图论的有向无环图来构建Global Web.Module) 并确定一个网页的重要性,我们假设一个网页的重要性取决于其他页面的引用,以及学术文章中的引用索引,重要的文章总是会被许多其他引用文章。然后我们根据搜索词执行超文本匹配分析(对机器人爬取的页面内容进行逆键索引检索),以确定与搜索查询最相关的网页。通过结合最重要的网页和与搜索查询最相关的网页这两个方面,我们可以将搜索结果按照相关性和与用户搜索查询的相关性进行排序,然后呈现给我们的用户。

数据中心:谷歌用来索引世界的塔

谷歌的数据中心是高度机密的,我们对它们知之甚少:

1、美国大陆有超过19个数据中心,其余17个数据中心分布在美国以外的全球范围内。

2、每个数据中心的面积为50万平方英尺,建设一个数据中心的成本约为6亿美元。

3. 谷歌数据中心是世界上效率最高的设施之一,而且非常环保,几乎没有碳排放。

4. 数据中心使用 50 到 100 兆瓦的电力,并且由于需要冷却,通常建在容易取水的地方。

5. Google 服务器安装在一组标准的家用邮箱中,其中包含 1,160 台服务器。

工艺流程

1. 您在 Twitter 上发布博客、推文、更新您的网站等,以向网络添加内容

2、谷歌爬虫(一个聪明的代理程序作为搜索引擎组件)爬取你网页的标题、描述、关键词等内容。

(1) 谷歌说唱歌手沿着链接路径走遍全站,除非你的站点有超文本路径,否则你的站点不会被索引。

(2) 如果您不允许在 robots.txt 中编入索引,Google 爬虫将不会抓取您的网页

(3) 如果链接到您网站的超链接上有 nofollow 标签,Google 说唱歌手将不会从这些链接前往您的网站。

(4) Google 还可以使用博客软件或 xml 网络地图找到您的站点

(5) PageRank 越高的网站到您网站的链接越多,您网站的 PageRank 越高。

(6) 谷歌爬虫会遍历所有未标记为nofollow的链接

3.一旦被谷歌说唱歌手访问,页面在几秒钟内被索引

(1) 网页内容存储在反向索引中

① 网页标题和链接数据存储在索引中,用于宽度优先搜索

② 网页内容存储在另一个索引中,用于不常进行的长尾、个性化、深度搜索。

(2)在谷歌上搜索时,没有找到万维网,但找到了谷歌的缓存,它定期更新其索引库,在实时推特搜索等竞争下,谷歌的索引图书馆更新。周期变短。

4. Google 根据链接评估域和网页的整体 PageRank 值。

5.检查网页,防止作弊

(1) 谷歌的搜索质量和反垃圾邮件审查和优化算法

(2) 10,000多名远程测试用户对搜索结果的质量进行评分

(3)谷歌邀请用户举报涉嫌PageRank勒索的垃圾邮件

(4) Google 被告知(美国)数字千年版权法案,要求 Google 从搜索结果中删除涉嫌盗版的内容。

6. 在对页面做了不好的分析之后,现在每个页面都有很多数据(如搜索关键字),用于帮助用户搜索回它。

7. 用户做搜索查询

(1) Patrick Riley,谷歌搜索质量工程师:在大多数谷歌搜索中,你的搜索是在谷歌实验室的许多并行检查过程或创新项目的过程中进行的。可以说,每一个问题请求都会参与到谷歌的一些创造性实验中。 .

8. 谷歌将使用同义词来匹配语义上与您的搜索词相似的搜索结果

9.生成以前的搜索结果

(1) 谷歌当然可以返回数千条搜索结果,但一般只显示不到1000条搜索结果。 (2) 放置搜索结果,本地网站会优先出现在搜索结果中

10、搜索结果集按权限和PageRank排序,去除重复查询结果。

(1) 谷歌根据关键词、广告类型和用户位置找到相关的关键词广告进行拍卖。

(2) 关键字必须符合当地法律法规

① 禁止广告主非法主张

② 如果关键字的搜索量过低或关键字的点击量过低,会自动关闭

③ 经营策略之外,亚马逊等客户会给予优惠折扣。

(3)关键词相关广告按收益潜力排序(关键词竞拍后的广告质量不断评估)

(4)对于广告主来说,广告的内容一般是固定的,但有时也会使用动态关键词,使关键词与搜索关键词的相关性更高。

① 某些广告本身允许添加各种附属信息,如链接、电话号码、产品链接、地址等。

(5)当广告的点击率足够高时,它会显示在搜索结果列表的顶部,使其更加突出。

(6) 剩余的债权依次显示在相应的位置

11.过滤搜索结果

(1)对于常见问题(如谷歌首页发布的搜索查询),谷歌还会在返回的搜索结果中添加相关的垂直搜索结果(如新闻、购买、视频、书籍、地图等)。

(2) 定制化:用户访问的网站在查询结果中会更高

(3) 使用大量锚点的网站可以从搜索结果中删除

(4)搜索结果集的分组:如果一个网页被其他高PageRank的网站引用,该网页的相关性将大大增加。

(5)趋势分析:对于搜索量爆炸性或新闻较多的搜索关键词,谷歌会在新的搜索结果中增加额外的PageRank权重。 (谷歌有一个反映关键词搜索流量的谷歌趋势页面)

(6) 同一域名下的多个网页如果PageRank相同,将被分组。

12. 最后,在浏览器端会向用户返回一个用户友好、布局合理、有独立搜索结果和广告的有机查询页面。

所有这些步骤都在不到 1 秒的总响应时间内完成,每天 3 亿次点击为谷歌带来超过 200 亿美元的年收入。

举报 使用道具

回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

搜索
热搜: 活动 交友 discuz

图文热点

  • 优化要学会分析细节 优化要学会分析细节 一个好的网站要做的事情很多,流量大的网站也不容易成功,而现在的搜索引擎都讲究内容
  • 关键词优化排版技巧 关键词优化排版技巧 网站需要很多基础的SEO优化设置,关键词排列需要优化。使用SEO中的关键字原则,将正确
  • SEO专员的工作流程 SEO专员的工作流程 SEO 专家工作流程(每日) 早晨一到,首先整理汇总网站SEO数据报告,发送给高层领导
  • 优化效果分析 优化效果分析 该行业的大部分流量来自自然搜索。搜索引擎优化是网站优化的重点。所以很多公司会时不
  • 网站SEO转化分析思路 网站SEO转化分析思路 网站SEO转化分析思路 1.百度统计/GA一般数据趋势: a) 某月数据的同比对比:会
更多

社区学堂

  • 优化要学会分析细节优化要学会分析细节 一个好的网站要做的事情很多,流量大的网站也不容易成功,而现在的搜索引擎都讲究内容
  • 关键词优化排版技巧关键词优化排版技巧 网站需要很多基础的SEO优化设置,关键词排列需要优化。使用SEO中的关键字原则,将正确
  • SEO专员的工作流程SEO专员的工作流程 SEO 专家工作流程(每日) 早晨一到,首先整理汇总网站SEO数据报告,发送给高层领导
更多

客服中心

400-050-3520 周一至周日 8:30-20:30 仅收市话费

关注我们

  • 手机客户端
  • 关注官方微信
关于我们
关于我们
友情链接
联系我们
帮助中心
网友中心
购买须知
支付方式
服务支持
资源下载
售后服务
定制流程
关注我们
官方微博
官方空间
官方微信
快速回复 返回顶部 返回列表