搜索引擎的基础原理知识

虽然说年轻人不讲武德,但是你和他讲搜索引擎还是讲不通的;虽然大多数人不知道搜索引擎的工作原理,但是怎么使用的话,大多数人都是溜溜的。只要在搜索引输入我们需要搜索的关键词,就可以在瞬间获取到我们想要的内容。

对于外行来说他只关注搜索到的内容,但是对于有一个SEO来说,应该会思考搜索引擎是如何的从海量的数据之中快速精准的找到我们需要的内容的。可以这么说很多人做SEO但是从来没有探索过搜索引擎的工作原理。今天我们就一起来探索下搜索引擎的一个基本的工作原理及流程,我们可以简单的把搜索引擎分为四个步骤:抓取、过滤筛选、建立索引及输出结果。


抓取

内容的抓取相信大家都是非常的了解的,就是我们乐此不疲的收录。搜索引擎的抓取内容是通过爬虫蜘蛛来实现的,各大搜索引擎的蜘蛛会根据自家的算法来对互联网上的各大网站进行数据的抓取。

面对互联网上海量的数据,如果每日对所有网站的数据进行实时的抓取显然是一件不可能完成的事情。因此对于搜索引擎的抓取工作是一项非常复杂的工程,是在很多算法的共同作用下,最终实现对于各个网站的评级给到不同优先级别进行抓取工作,来达到在有限的资源条件下获取更多有价值的信息。

搜索引擎的工作原理

过滤筛选

很多人认为内容被抓取了就会被收录,其实并非如此;其实你可以看一下网站日志,只要网站是一个正常的网站没有被K站,基本上新内容提交连接推送之后,过一段时间蜘蛛肯定是回来进行抓取的。

但是事实上,我们有很多内容是有抓取记录但是却一直是不收录的,这个其实主要是内容的质量并不达标,在抓取之后是有一步过滤筛选的,对于页面存在问题或者内容的意义不大的页面,基本都是会被直接过滤掉,是完成没有被收录的机会的。


建立索引

上边也讲到了当我们在搜索框输入搜索词之后可以在瞬间返回结果,那么必然不是得到关键词之后再去检索相关内容的;所以搜索引擎对于抓取的内容会建立相关的结构数据建立对应关键词的搜索引,也就是我们常说的索引量。

网站内容建立索引是被搜索到的基本条件,只有对关键词事先建立了索引数据,这样才有可能做到在搜索的瞬间呈现出结果。


输出结果

当然用户搜索的关键词是千奇百怪的,充满了无数的可能性,因此也不能对搜索有关键词都创建对应的索引,这个时候更多时候还是需要依靠算法,将搜索关键词和现有搜索引库中的数据进行一定关系上匹配,找到最相关的内容进行一个呈现。



申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用!

本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理

本文地址:https://www.chateach.com/seo/seoxinde/617

相关文章

  • 百度原创星火计划是什么

    星火计划

    百度原创星火计划(又称伪原创的算法)是在,百度搜索团队首次表示,正在设计一套较完善的原创识别算法,并提出了互联网生态的项目课题,是为了解决原创内容的搜索排名问题。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1907
    • 星火计划
  • 必应搜索引擎如何进行手动URL提交

    URL提交,必应

    必应搜索引擎找不要手动URL提交入口的速度来看解决方案。如何在必应搜索引擎上提交站点的URL链接呢?有很多小伙伴反馈,在必应站长工具后台找不到手动提交URL的入口,今天潘某人SEO就来分享下,如何在必应搜索引擎站长后台进行手动URL连接的提交。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 6305
    • URL提交
    • 必应
  • 移动站点SEO优化不可忽视的点

    SEO优化

    随着智能手机的普及,移动互联网已经成为我们日常生活中不可或缺的一部分。特别是在电商领域,移动端的成交量已经远超PC端,成为主流。面对这样的趋势,如何优化我们的手机网站,以提供最佳用户体验并促进转化率呢?今天潘某人SEO就来探讨下手机网站优化的关键点,帮助您在竞争激烈的市场中占据优势。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 345
    • SEO优化
  • 仿站相似站会对SEO有影响吗

    仿站SEO

    仿站或者类似结构站点会对SEO有影响吗?如何去搭建网站才能更加利于站点的seo优化呢?仿站对于网站优化的利弊有哪些呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 803
    • 仿站SEO
  • 必应搜索SEO优化值得做吗

    必应搜索,SEO优化

    对于站点SEO优化来说,必应不但可以带来可观的流量,也同时降低了站点运营风险,如今搜索引擎竞争激烈,算法调整,站点流量的稳定性就是一个不可控的因素。在条件允许的前提下,必应搜索是非常值得一做。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1177
    • 必应搜索
    • SEO优化
  • HillTop谷歌排名算法

    HillTop算法

    HillTop算法可以有效的屏蔽垃圾低质量外链,防止外链作弊。其实HillTop算法的指导思想和PageRank的是一致的,都是通过网页被链接的数量和质量来确定搜索结果的排序权重。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2571
    • HillTop算法
  • 同一台服务器多个网站会影响SEO吗?

    服务器多个网站

    对小型站点使用独立服务器的成本会有点高,尤其是网站前期流量不大的时候,使用虚拟服务器就足够应付了。同一个服务器部署很多站点,是否回被判断为群站被惩罚,导致SEO优化效果不佳呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 980
    • 服务器多个网站
  • 被k网站的症状,恢复需要多久,如何操作呢?

    被k网站恢复,降权

    网站被K也是常有的事情,一夜之间前功尽弃的站点屡见不鲜,那么网站被K之后如何处理才能尽快的恢复,站点又如何预防K站的情况发生呢!

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1035
    • 被k网站恢复
    • 降权
  • SEO核心内容为王,外链为皇

    内容为王,外链为皇,外链的重要性

    内容和外链到底谁更重要,真的是传说在的外链为皇,内容为王吗?真相往往是残酷的。偏离的外链的本质,人云亦云,执着于错误中乐此不疲,也是一个神奇的现象,网站优化更需要的是了解每一个动作的本质。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1879
    • 内容为王
    • 外链为皇
    • 外链的重要性
  • 网站TDK常规写法

    description描述标签,keywords标签,title标签

    本段文字讲述 title标题标签 、keywords关键词标签 、 description描述标签 该如何撰写以及所需注意事项。TDK最重要的一条就是要与文章内容高度相关,而不是想写什么就写什

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1694
    • description描述标签
    • keywords标签
    • title标签
  • 网站Site出图率是什么?对排名有什么影响?

    Site出图率

    网站Site出图率是什么?对排名有什么影响?对于SEO优化来说网站的site出图率越高越好,这个更主要的处于在吸引用户点击作用上的考量,有图片的内容更容易获取用户的目光,提高了获得点击的几率,对于关键词的排名可以起到一个很好的促进作用。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1442
    • Site出图率
  • 搜索引擎如何判断内容的原创

    如何判断内容的原创

    搜索引擎其实并不能判断内容的到底是谁原创,看似有点惨无人道,原创成为抄袭。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1904
    • 如何判断内容的原创
  • 百度spider抓取过程中涉及的网络协议

    百度spider,抓取

    刚才提到百度搜索引擎会设计复杂的抓取策略,其实搜索引擎与资源提供者之间存在相互依赖的关系,其中搜索引擎需要站长为其提供资源,否则搜索引擎就无法满足用户检索需求;而站长需要通过搜索引擎将自己的 内容推广出去获取更多的受众。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 658
    • 百度spider
    • 抓取
  • 网站如何制作才会被百度收录?

    网站内容规划

    网站如何制作才会被百度收录? 新网站建设成功后,只有在百度等大型网站被审核认可后,才能被其他人搜索,所以如何使百度收录成为一个非常重要的问题

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2447
    • 网站内容规划
  • 如何快速提升关键词排名?

    提升关键词排名

    如何快速提升关键词排名?可以从流量冲击、时效性热点内容 、高质量外链、网站整体权重、交换一些友情链接,多角度同时进行有效快速提升关键词排名。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1481
    • 提升关键词排名
  • PageRank排名算法

    PageRank算法

    PageRank排名算法,是一种由根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一。在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2736
    • PageRank算法
  • 网站更新和排名之间的关系你知道吗

    网站更新,网站排名

    大多数站长会认为网站的流量靠的是不断的更新才可以稳定的获取流量,那么事实真的是如此吗?加入网站长期不更新,那么站点的流量和排名会消失吗?今天我们就来探索下网站排名流量和网站更新之间的关系。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 949
    • 网站更新
    • 网站排名
  • SEO从业者格局打开路也就宽了

    SEO发展,SEO优化

    对于SEO从业者首先要打开格局眼界,才能在SEO优化的路上走远。很多SEO从业者在未自己的再来迷茫,不得不说如今的SEO市场的确也不咋地,不是说SEO优化没有前景,而是SEO的环境很差,有点劣币驱逐良币。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 906
    • SEO发展
    • SEO优化