首页 >  SEO >  SEO知识 >  正文

页面收录是一个怎么样的流程

 作者:潘某人SEO
1237

网站优化收录是我们每天关注的,但是你是否知道收录的流程呢?了解网页是如何被收录的,把收录的流程了解清楚对于优化工作是有很大的意义的。其实大家口中所说的收录准确来说应该是索引,索引和收录的区别简而言之,就是搜索引擎蜘蛛抓取了链接即为收录,然后经过算法处理建立索引,这个时候便可以在搜索引擎上搜索到结果,也就是我们常说的收录,所以准确的说应该称之为索引。

不管是什么搜索引擎,大致的原理都是一样的,整个收录过程大致可以分为三步,分别是抓取、识别、释放。而且一切的基础都是依托于搜索引擎蜘蛛的。蜘蛛在整个搜索引擎中是先头部队,负责去与各站点的服务器建立接连,抓取下载网页上的文字、图片、视频等内容。

爬行与抓取

抓取也就是上面讲到的收录,搜索引擎蜘蛛抓取到网页链接。我以百度搜索引擎为例,百度蜘蛛抓取链接的主要方式途径有,站点的链接推送、互联网上的外链。蜘蛛会抓取网页上的文字以及代码,生成一份快照保存在搜索引擎服务器。对于已经收录的链接,那么会根据算法决定是否去重新抓取,或者直接略过抓取。

识别

对于抓取来的数据,会进行文字提取、分词、语义分析等一系列复杂的过程,结合搜索需求等因素,决定当前页面适合符合建立搜索引的调价。这也是一个关键的环节,是为什么有的站点内容会被抓取,但是一个无法被收录。绝大部分就是在这个环节因为内容不达标,而不被建立索引库,那么后续的展现就无缘了。

页面收录流程

释放展现

对于满足条件的页面会建立搜索引库,在需要的时候进行释放。此时用户通过在搜索引数据搜索关键词,那么相关联的索引结果就会呈现给用户。结合页面与关键词的相关性以及站点的整体质量来决定显示的排名位置。

并且搜索引擎会根据用户浏览搜索结果时的行为反馈,来对于关键词的排名位置进行一个调整。

索引删除

我们有的时候会发展已经收录的内容,过段时间之后又被取消收录了。这个其实是一种很正常的现象,搜索引擎会根据最近的搜索需求,来删除过时没加价值的索引;同时也会放出更有价值的内容。

索引量下降20%甚至更多都是正常的,站点只需要关注流量的变化,不要过度关注搜索引量的变化,大家对于索引量要有正确的认识。当然如果索引量对半的掉同时流量展现都收到影响,那么就需要警惕重视,是否存在违规行为被打击。

公众号
潘某人SEO 关注我每天学习SEO优化相关知识... 470篇原创内容
潘某SEO 公众号
申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于CC0协议或已获得VRF授权的图库站点 版权申明:本文为博主原创,未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本文地址:https://www.chateach.com/seo/seozhishi/669
相关文章
  • 搜索引擎的工作原理

    搜索引擎工作原理,收录原理

    讲述搜索引擎的工作原理,以及SEO优化中如何提高收录效率的方法。提高网站内容的质量原创度,稀缺性,和搜索引擎建立良好的信任关系。

    1038
    • 搜索引擎工作原理
    • 收录原理
  • 搜索引擎如何判断内容的原创

    如何判断内容的原创

    搜索引擎其实并不能判断内容的到底是谁原创,看似有点惨无人道,原创成为抄袭。

    1273
    • 如何判断内容的原创
  • 如何让搜索引擎识别页面是PC还是移动端

    SEO页面类型识别

    如何让搜索引擎识别页面是PC还是移动端,让蜘蛛有效的识别页面类型,可以使得抓取更有效率,同时给用户在不同设备访问时,给到正确的对应页面,提升用户体验。

    2551
    • SEO页面类型识别
  • 搜索引擎蜘蛛爬虫名大全

    搜索蜘蛛大全

    对于seo们清楚掌握主流搜索引擎的爬虫名称十分的关键,掌握各大搜索引擎蜘蛛爬虫,对我们开展网站SEO优化具有挺大作用;作者搜集了各大搜索引擎的蜘蛛爬虫UA,便于你需要时查看。

    1505
    • 搜索蜘蛛大全
  • 搜索引擎高级搜索指令大全

    高级搜索指令大全

    搜索引擎高级搜索指令大全。普通的搜索肯定需要会,但是有一些特殊的搜索是SEO必修课程。下面就来介绍一下搜索引擎的特殊搜索——高级搜索指令。

    1210
    • 高级搜索指令大全
  • 百度搜索引擎蜘蛛喜欢什么样的网站结构

    seo网站结构

    百度搜索引擎蜘蛛喜欢什么样的网站结构?希望能在百度获得好的排名、更多优质低价的流量,这个前提就是网站得有好的结构,百度蜘蛛才能顺利、快速的抓取,也就是说网站结构是关键词排名、链接优化、内容优化的前提。

    1235
    • seo网站结构
  • 搜索引擎的基础原理知识

    搜索引擎原理

    搜索引擎的基础知识,从抓取、过滤筛选、建立索引及输出结果,这几个步骤的工作原理。对于SEO优化来说如果连搜索引擎的基本工作原理都不清楚,这样是一件非常糟糕的事情。

    676
    • 搜索引擎原理
  • 搜索引擎抓取系统概述

    搜索引擎,蜘蛛

    今天就给大家简单的介绍一下搜索引擎系统大致工作原理,内容比较多会分几次更新,大家记得关注“潘某人SEO”坐等更新。先给大家介绍下搜索引擎的基础知识:抓取系统基本框架、抓取中涉及的网络协议、抓取的基本过程三部分。

    680
    • 搜索引擎
    • 蜘蛛
  • 搜索引擎检索原理解析

    搜索引擎,检索原理

    搜索引擎检索原理解析,搜索引擎是如何实现关键词的精准匹配?

    751
    • 搜索引擎
    • 检索原理
  • 搜索引擎内容原创性之分词技术与文本粒度

    分词技术,文本的粒度,内容原创性

    seo优化中内容的原创性是非常重要的,那么对于搜索引擎是如何判断内容的原创性呢?从分词技术和文本粒度来研究下伪原创内容对于SEO优化存在意义。

    466
    • 分词技术
    • 文本的粒度
    • 内容原创性
  • 各搜索引擎蜘蛛IP大全持续更新

    蜘蛛IP,引擎蜘蛛

    各搜索引擎蜘蛛IP大全持续更新,各个搜索引擎的蜘蛛ua,持续更新中。

    1574
    • 蜘蛛IP
    • 引擎蜘蛛
  • ChatGPT将革新搜索引擎跨入新时代

    ChatGPT,搜索引擎发展

    ​ChatGPT的发布代表着人工智能技术开启了新篇章,不少人开始纷纷感受到了恐惧,在不久的将来被ChatGPT所淘汰,这个就让我们拭目以待吧。作为SEO从业者,最关注的还是ChatGPT会对搜索引擎的发展带来何种影响呢?

    381
    • ChatGPT
    • 搜索引擎发展
  • 搜索引擎网页质量判定的标准

    搜索引擎,网页质量

    搜索引擎的根本是什么,是内容是对于用户搜索需求满足,这是搜索引擎最根本的逻辑,后续的一切也都是根据这个方向展开的。根据《百度搜索引擎网页质量白皮书》,站长们在百度搜索引擎优化中如何才能输出高质量内容呢?

    248
    • 搜索引擎
    • 网页质量
  • 网站旧页面不收录怎么办

    旧文章不收录

    网站旧文章页面不收录问题是每个站点都会遇到问题,每个站点都会有这种情况有的页面从发布至今一直都不收录,还有一部分页面收录之后很快又掉了,对于这些为收录的页面,我们有什么方法可以让他们重新进行收录呢?

    642
    • 旧文章不收录
  • SEO从业者必须掌握的TDK优化技巧

    SEO关键词,TDK编写,网站描述优化

    SEO从业者需要知道网站TDK是什么,需要知道SEO改如何编写关键词标题描述,现在对于搜索引擎来说关键词和描述并不是很重要了,这么调整原因就是太多了的人乱写关键词,文章与关键词相关性低;不过如果你的关

    1438
    • SEO关键词
    • TDK编写
    • 网站描述优化
  • 百度快照与权重的关系

    权重,百度快照

    百度快照与权重的关系,事实上百度快照并不能反映出搜索引擎蜘蛛抓取网站数据的时间,更不能决定页面的权重。所以大家不必过度的关注百度快照

    1069
    • 权重
    • 百度快照
  • 如何使用Canonical标签解决重复页

    Canonical标签

    Canonical标签用于告知搜索引擎,重复页面中哪个页面是规范页,有利于集中权重提升排名,但是总体来说Canonical标签能不用!就不用了

    1335
    • Canonical标签
  • keywords、description已经不重要了?

    keywords和description,SEO标签,关键词和描述

    不要随大众觉得keywords、description,即SEO优化中常说的关键词和描述两大SEO标签不在重要,这种观点过于果断缺乏依据。无论搜索引擎怎么调整。

    1720
    • keywords和description
    • SEO标签
    • 关键词和描述
-- 这已经是底线了,看看别的把! --