当前位置: 首页 > 设计知识 > 企业官网设计 > 搜索引擎是如何工作的
简单来说,搜索引擎是由网络爬虫、索引数据库、其他辅助程序和搜索结果显示页面组成的。搜索引擎首先会排除能够从网络上自动搜集信息的搜索引擎蜘蛛(spider),通过互联网之间的URL链接来获取到网页的内容,接着,搜索引擎会把找到的这些信息带回数据服务器,由分析索引系统对搜集广州网站设计回来的信息进行分析处理,例如提取url、提取页面编码、获取网页各项内容和页面生成时间等。搜索引擎根据大量的相关度算法对这些网页进行计算,得出网页与关键词之间的相关度,在将得到的结果进行分类、消重、清除SPAM(搜索引擎垃圾网页)等一系列的工作后,搜索引擎会把这些信息录入到索引数据库中。当用户进行相关关键词的查询时,搜索引擎会从索引数据库中找到最匹配的信息,反馈给用户。在这个工程中,大部分工作是由计算机程序完成的,只有在处理一些特殊数据的时候,才会采取人工干预手段。如果要优化好这样百度指数高的关键词,就要多做工作了哦。
什么是搜索引擎蜘蛛(spider)
把互联网看做是一个蜘蛛网,那么spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从某一页面开始,读取网页的内容,然后找到其他页面,一直循环下去,知道抓取完所有页面信息。
简单介绍一下蜘蛛在网站上采集内容的过程。
1、检查网页是不是有过更新。蜘蛛会和服务器上的快照相比,如果不同,就抓取新的内容页面,将其带到搜索引擎的数据库,并更新原来的网页快照。
2、如果是新网页,蜘蛛不但要抓取网页的内容,还要将URL带到搜索引擎数据库。
3、经过数据处理,将蜘蛛带回来的数据建立新的网页索引,并按照与关键词的相关排序
上一篇:如何在短时间内做好网站内部优化
下一篇:如何打造网站高质量外链
扫一扫关注古柏
GOOBAI AD.
Brand Whole Case Design
4000-882-993
www.goobai.com
微信加好友咨询
广州古柏广告策划有限公司
地址:广州市天河区东圃长盛商务大厦B213-215
Copyright©2004-2020 GOOBAI Inc.All rights reserved
粤公网安备: 44010602001481号
备案号:粤ICP备09222445号
与古柏对话
关注古柏