首页 >  SEO >  SEO心得 >  正文

搜索引擎的基础原理知识

 作者:潘某人SEO
1027

虽然说年轻人不讲武德,但是你和他讲搜索引擎还是讲不通的;虽然大多数人不知道搜索引擎的工作原理,但是怎么使用的话,大多数人都是溜溜的。只要在搜索引输入我们需要搜索的关键词,就可以在瞬间获取到我们想要的内容。

对于外行来说他只关注搜索到的内容,但是对于有一个SEO来说,应该会思考搜索引擎是如何的从海量的数据之中快速精准的找到我们需要的内容的。可以这么说很多人做SEO但是从来没有探索过搜索引擎的工作原理。今天我们就一起来探索下搜索引擎的一个基本的工作原理及流程,我们可以简单的把搜索引擎分为四个步骤:抓取、过滤筛选、建立索引及输出结果。


抓取

内容的抓取相信大家都是非常的了解的,就是我们乐此不疲的收录。搜索引擎的抓取内容是通过爬虫蜘蛛来实现的,各大搜索引擎的蜘蛛会根据自家的算法来对互联网上的各大网站进行数据的抓取。

面对互联网上海量的数据,如果每日对所有网站的数据进行实时的抓取显然是一件不可能完成的事情。因此对于搜索引擎的抓取工作是一项非常复杂的工程,是在很多算法的共同作用下,最终实现对于各个网站的评级给到不同优先级别进行抓取工作,来达到在有限的资源条件下获取更多有价值的信息。

搜索引擎的工作原理

过滤筛选

很多人认为内容被抓取了就会被收录,其实并非如此;其实你可以看一下网站日志,只要网站是一个正常的网站没有被K站,基本上新内容提交连接推送之后,过一段时间蜘蛛肯定是回来进行抓取的。

但是事实上,我们有很多内容是有抓取记录但是却一直是不收录的,这个其实主要是内容的质量并不达标,在抓取之后是有一步过滤筛选的,对于页面存在问题或者内容的意义不大的页面,基本都是会被直接过滤掉,是完成没有被收录的机会的。


建立索引

上边也讲到了当我们在搜索框输入搜索词之后可以在瞬间返回结果,那么必然不是得到关键词之后再去检索相关内容的;所以搜索引擎对于抓取的内容会建立相关的结构数据建立对应关键词的搜索引,也就是我们常说的索引量。

网站内容建立索引是被搜索到的基本条件,只有对关键词事先建立了索引数据,这样才有可能做到在搜索的瞬间呈现出结果。


输出结果

当然用户搜索的关键词是千奇百怪的,充满了无数的可能性,因此也不能对搜索有关键词都创建对应的索引,这个时候更多时候还是需要依靠算法,将搜索关键词和现有搜索引库中的数据进行一定关系上匹配,找到最相关的内容进行一个呈现。



申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seoxinde/617
相关文章
  • 稀缺性内容快速提升站点收录

    稀缺性内容,站点收录

    很多站点面临的内容收录少并且收录周期长的问题,网站收录少收录慢的快速进来围观,今日分享一个可以快速提升站点收录量及收录速度的方法。

    579
    • 稀缺性内容
    • 站点收录
  • 关键词难易度评估方法

    关键词难度评估

    选好关键词是SEO优化的关键因素,关键词的质量可以决定搜索量、排名、以及转化等。关键词是网站和搜索引擎和用户三者衔接的桥梁。关键词的选择充满了奥秘,简单的讲我们需要考虑这个关键词的搜索量毕竟没有流量的关键词排名再高也没用,其次关键词的排名对于自己站点的难易程度,以及最关键的流量以及转化的平衡点的把握。

    878
    • 关键词难度评估
  • 网站标题关键词结构布局

    网站标题布局

    网站标题关键词结构布局,对于网站结构比较复杂的网站,那么为了使得网站结构有一定的条理性,那么这么网站的标题就需要一定的布局。

    1320
    • 网站标题布局
  • 搜索引擎检索原理解析

    搜索引擎,检索原理

    搜索引擎检索原理解析,搜索引擎是如何实现关键词的精准匹配?

    1157
    • 搜索引擎
    • 检索原理
  • Tag标签页面如何优化?

    Tag标签页面

    你知道什么是tag‘页面吗?什么样的站点适合去tag页面呢?tag页面又叫标签页面,是一种网站内容的分类方式。常见的实现方式是通过给各个页面打上标签,然后以这个标签为主题来聚合相关的页面。

    1036
    • Tag标签页面
  • 网站排名靠前的方法

    排名靠前的方法

    网站排名靠前的方法?如何让网站内容排到首页是所有SEOER们日思夜想的问题,其实当关键词的排名到了前50,或者说想进入前二页并不是简单的靠页面优化就可以达到的排名,无论你页面关键词布局多么合理,只要不是权重绝对高,基本上是很难进入前二页的。

    872
    • 排名靠前的方法
  • https网站对排名有好处吗?

    HTTPS与SEO优化

    最近几年https开始出现在我们眼前,越来越多的网站开始从http协议升级为HTTPS协议,那么站在网站SEO优化的角度,https对于网站的排名等各项指标是否能提供帮助呢?那么我们就需要先了解https协议于传统http的区别,那么你到时候就自然明白了https到底会与会影响SEO优化。

    1286
    • HTTPS与SEO优化
  • 如何防止网站内容被复制

    防止复制,js

    通过js修改document上的相关属性值来实,防止网站内容被复制。

    1145
    • 防止复制
    • js
  • 如何识别百度蜘蛛

    百度蜘蛛辨别

    如何识别百度蜘蛛,百度蜘蛛对于站长来说可谓上宾,可是我们曾经遇到站长这样提问:我们如何判断疯狂抓我们网站内容的蜘蛛是不是百度的?

    1303
    • 百度蜘蛛辨别
  • 百度搜索引擎蜘蛛喜欢什么样的网站结构

    seo网站结构

    百度搜索引擎蜘蛛喜欢什么样的网站结构?希望能在百度获得好的排名、更多优质低价的流量,这个前提就是网站得有好的结构,百度蜘蛛才能顺利、快速的抓取,也就是说网站结构是关键词排名、链接优化、内容优化的前提。

    1532
    • seo网站结构
  • 网址结构优化对于SEO的重要性

    网址结构,网站层级

    你的网站的结构是怎么样的结构呢?是佛性随意来,还是条例清晰彰显网站结构层级的呢?不要忽视网址结构的设计对于SEO优化还是比较重要的一个方面。

    1114
    • 网址结构
    • 网站层级
  • robots协议不生效怎么处理

    robots

    为什么明明已经设正确设置的robots的屏蔽规则,但是就是不生效导致不该收录的内容被收录了呢?

    637
    • robots
  • SEO关键词你选对了吗?分享选词妙招!

    SEO,关键词,选词

    ​关键词是SEO优化核心之一,也是用户、搜索引擎和站点之间的桥梁,用户通过在搜索引擎使用关键词搜索所需的内容,搜索引擎通过关键词实现内容的索引和排序的建立。潘某人SEO常用的选词方法分享给大家。

    512
    • SEO
    • 关键词
    • 选词
  • 百度蓝算算法打击什么

    新闻源,蓝天算法

    百度蓝天算法是一个比较久远的算法了,是在16年的时候上线的,主要是用于打击新闻源站点售卖目录的行为,还互联网一片蓝天。

    2291
    • 新闻源
    • 蓝天算法
  • 网站安全对百度SEO有何重要性

    网站安全与SEO的关系

    网站安全对百度SEO有何重要性?国内至少有80%的网站存在着安全问题,严重困扰并威胁着网站的正常运维。那你的网站存在安全问题吗,该如何解决网站的安全问题?

    1194
    • 网站安全与SEO的关系
  • 索引量变化存在的误区

    索引量

    索引量是那个站长都会关注的点,对于SEO优化来说是非常重要的指标,但是很多人对于索引量的变化存在错误的认知,为大家总结了常见的对于索引量变化的误区。要正确的认知索引量变化的影响,首先要明白什么是索引量。索引量简单讲就是站点内容经过搜索引擎抓取,算法分析之后符合标准,建立索引进入索引库的数量,内容只有进入的索引库是进行排名展现的必要条件。

    674
    • 索引量
  • 用户喜欢的内容的样子,你知道吗

    SEO优化,用户喜欢的内容

    SEO优化回归本质是内容的优化,内容的核心是基于用户的需求,那么你了解用户吗?用户真正想要的内容是怎么样呢?当你搞明白了这个问题,相信对于的SEO优化会有很大的帮助。

    868
    • SEO优化
    • 用户喜欢的内容
  • 百度蜘蛛有权重之分吗?

    百度蜘蛛,权重

    百度搜索学院线上公开课第六讲——网站抓取建设指南,在这个百度官方的直播课程回放中,最后百度搜索工程师最后的QA中明确的表明了不存在蜘蛛权重之分的行为。

    2051
    • 百度蜘蛛
    • 权重
-- 这已经是底线了,看看别的把! --