死链的正确处理方式,自动化提交,超详细全面教程!

死链提交是SEO优化中常见的一环,但是你处理死链的方式真的正确吗?可以说很多人并没有掌握正确的打开方式,今天潘某人SEO就分享一份详尽的死链处理方案教程,文章比较长,建议收藏保不齐哪一天就用的上了。

什么是死链

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链: 页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链: 服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。内容死链召回存在召回率的风险,所以一定记得要用协议死链的方式。

死链内容的来源

只有搞清楚死链的来源,才能避免遗漏,死链的来源多种多样,常见的有一下几种情况。
主动删除: 在站点运营的时候,难免会出现一些内容,因为各种原因,需要进行删除的。
程序错误: 在站点更新的时候,程序出现了吗bug,导致部分资源的访问出现了问题,导致出现一些意料之外的死链。
网站改版: 网站改版尤其是设计到结构上的改版,对网址路径也做了变更的时候,会出现一些死链;所以,一定记得要做新旧内容地址的301跳转。
网站被黑: 网站被黑,时常会被生成大量的垃圾页面,站点修复后,这类页面就会产生大量的死链。

死链如何正确处理

网站出现大量死链,会影响站点在搜索引擎的站点评级,所以及时正确的处理死链,对于SEO优化至关重要。
首先要确保内容的页面的TCP/HTTP协议明确表示页面是死链,也就是页面必须返回404(未找到)、403(禁止访问)、503(服务不可用)等;推荐使用页面返回404状态码。
很多站点做到这一步就结束了,这是不可取的,一定要主动去对应搜索引擎的站长后台提交死链。如果仅仅依靠搜索引擎的日常抓取发现死链,处理周期会非常的常,甚至会有遗漏。
就会导致还是有大量的死链内容继续参与展现,带来不好的用户体验,尤其是链接数量较多的情况,必然会被站点SEO造成负面影响。

哪些死链需要提交

并不是所有的死链需要在搜索引擎提交死链,仅仅需要提交一些已经被搜索引擎收录的内容或者可能被收录的内容的链接,很多时候收录在抓取之后需要一定周期。
但是对于一些原本就搜索引擎无法抓取的内容,如有访问权限的内容,或者是刚创建并且没有推送给搜索引擎抓取的内容,就没有提交的必要。
在实际操作中,无法挨个排查收录的情况,所以普遍的做法就是将搜索引擎有访问权限,可能被抓取到的都提交死链。

如何发现死链

对于一些自主删除的内容,这部分死链是非常清晰没有问题的,但是一些潜藏的死链,显然是无法直接预知的。这就需要在站点后端添加统计,对于返回404等状态码的页面路径进行记录;或者是定期分析网站日志对异常访问记录进行筛选处理。但是一般来说我们会发现一些大量404页面,并且并不是正常的路径。
那首先可能是一些恶意访问,暴力枚举刷后台的,这种不归于死链;但是反之如果是非常规的路径但是访问成功了,那么就要仔细排查了,网站是否被有被攻击。
对于一些符合路径规则的404访问,那就需要具体分析,虽然符合路径也有可能是一些恶意访问。最终需要的是符合站点路径规则的404页面,尤其是搜索引擎访问报错的链接,注重分辨真假蜘蛛。
对于网站被黑生成的链接,可以通过排除正常路径,获得所有链接的集合,来作为死链提交。

如何提交死链

不同的搜索引擎的站长工具,死链提交的工具会有差异,但是大致都是支持单链接提交和文件提交方式,少量的死链使用单链接提交,数量较多的死链使用文件提交,下面潘某人SEO就和大家看看国内常见搜索引擎的死链提交工具。

百度搜索引擎

百度死链提交工具
如上图是百度搜索资源平台的死链提交工具,提供了快速死链和普通死链两种方式,死链提交之后,百度蜘蛛抓取后,死链抓取状态可在提交列表中查看,死链抓取后生效时间为1周,如超时未生效依然是收录状态,可以在反馈中心提交反馈。
快速死链: 死链规则30天内提交数量上限为100条,超出范围的数据暂时无法提交。已生效数据记录仅在列表中保留30天,列表中规则总数小于100条时可以提交新规则。但是实际可以提交多少取决于账户的提交额度,会有所不同。
百度死链文件提交
普通死链: 文件地址格式为txt或xml,每个地址文件最多包含50000个网址且需小于10MB;不支持索引型sitemap;文件中只可包含该网站主域下的网址。在提交的时候选择正确的更新周期,取决于站点提交的死链文件的更新周期。如果只是偶尔提交死链,一定把抓取周期填久点,并且如上图所示的死链处理状态状态显示已删除之后之后及时删除提交的该条死链文件,避免重复无效的抓取。

360搜索引擎

360死链提交
360搜索引擎同样支持,单链接和文件提交两种方式,不同的是两者的提交入口是不区分的、公用的,在同一个位置提交死链地址,或者是死链文件地址,有更新相关的字段,但是没有对更新周期的描述。
死链文件,格式为txt或xml。如死链文件超过12个,以文件格式提交。

搜狗搜索引擎

搜狗死链提交
搜狗搜索引擎,同样的支持单链接和文件提交方式。与百度和360搜索引擎不同的是搜狗搜索引擎支持规则提交。
文件提交支持xml格式和TXT格式两种格式文件。规则提交则是以斜杠/或问号?两种形式结尾的死链规则形式提交死链前缀,下面有详细解释。
搜狗搜索引擎单个站点每日提交死链限额为100w条url,若超过限额则返回“超出限额”状态。文件提交中每个文件最多可包含50000个网址,并且文件应小于10MB,文件总个数不超过100个。
规则提交,支持目录规则和CGI规则,目录规则:以“/”结尾的前缀、CGI规则:以“?”结尾的前缀。
分别表示删除一个目录或者CGI形式的通配链接,例如:https://www.chateach.com/seo/ 表示将seo目录之下所有的链接作为死链提交;https://www.chateach.com/seo? 则表示将满足seo?*所有的链接作为死链提交,*号是通配符可以代表任何内容。
这个规则提交功能还是非常棒的,一条规则可以搞定,特别适合整个目录删除或者网站被黑有大量同目录的死链的情况。
但是需要注意的是如果当前目录提交死链之后,在提交之后有新的死链,则需重新提交死链规则,并且必须在上次提交之后的30天后重新提交。
如果提交的新规则,被已提交的规则所包含,则会被忽略,同样的需要在30天后再提交,才能被处理。

总结一下,三者都支持单链接和文件提交,搜狗搜索引擎额外的还支持规则提交。只有百度和搜狗搜索引擎可以对死链文件更新抓取,其中百度搜索引擎可以设置更新周期,搜狗搜索引擎无法设置更新周期;360搜索引擎无更新抓取功能,提交属于一次性的。

死链提交方案

设想是能实现自动化提交死链,避免繁杂的定期提交,由于只有百度搜索引擎能够定期抓取死链文件,因此自动提交死链接也就适用于百度和搜狗搜索引擎,360搜索引擎死链文件只能手动提交了。

文件格式

三者都可以使用文件提交方式,直接使用txt文件方式提交,内行一条链接,不超过50000条,并且文件大小不超过10M。如果超过那就需要分次提交或者分割成多个文件提交。

如果站点的死链提交频次不高,那么直接全部使用手动提交,更加的简单,没有必要整自动提交。将站点所有的死链,生成txt文件,防止网站更目录,然后直接提交对应的访问地址即可,注重不能有任何的访问权限限制。

自动提交实现

如果站点经常性会有死链生成,那么就可以使用自动提交方式,但是需要成本两份文件,一个用于百度和搜狗搜索引擎的自动更新抓取,另一个用于手动提交其它搜索引擎;但是百度和搜狗的更新抓取周期并不一致,为了减少等待周期,可以分为不同的两个文件单独处理。

在网站根目录下定时更新死链文件,注意不是实时更新,而是按照一定条件触发更新,可以以静态文件的形式。更新触发条件为,监控当前死链文件路径地址,被搜索引擎抓取时则进行死链文件的更新。

每次更新的时候,将上次文件中的链接,在数据库中标记为已处理的链接。每次更新的死链文件中只包含未提交过的链接。为了提高效率,如果当后台有新死链接生成的时候而搜索引擎还未进行本周期的抓取,可以直接追加到当前死链文件中。

结合站点死链生成的周期,在百度搜索引擎死链提交工具中设置对应的更新周期。如此所有引擎会定期抓取死链文件,站点监控到抓取,则标记当前文件的中的死链为已处理,把待处理的死链更新到文件中,周而复始的自动提交死链了。

对于无法自动更新抓取的搜索引擎,则另外生成一份死链文件,可以把时间周期调长。对比也可以加上搜索监控,逻辑按上述自动提交的一致,在被360搜索引擎抓取之后,标记已有数据为已处理同时将待提交的死链更新到死链文件,然后手动提交到死链工具中,然后也能实现半自动。

从此你就告别了,每次死链提交时,思考要如何获取哪些链接作为死链提交,踏入了自动和半自动提交死链的时代!

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用!

本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理

本文地址:https://www.chateach.com/seo/seozhishi/1075tijiao

相关文章

  • 如何屏蔽某些页面的抓取,但是让页面中链接正常抓取

    meta标签屏蔽页面抓取

    如何屏蔽某些页面的抓取,但是让页面中链接正常抓取,对于这种情况,使用meta标签来进行屏蔽页面的抓取,可以变得更加的有效。相比常用的robots文件屏蔽,或者nofollow标签屏蔽的实用性更加的广。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 3305
    • meta标签屏蔽页面抓取
  • 为什么打击采集行为,采集站还是有很高权重

    采集,权重

    搜索引擎不断的打击采集行为,但是采集站点的收录排名和权重还是非常好;如果你无法理解那么你对于搜索引擎的核心不够了解,本文带你探索搜索引擎和采集的那点事,教你如果正确面对采集行为。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1055
    • 采集
    • 权重
  • 网站旧页面不收录怎么办

    旧文章不收录

    网站旧文章页面不收录问题是每个站点都会遇到问题,每个站点都会有这种情况有的页面从发布至今一直都不收录,还有一部分页面收录之后很快又掉了,对于这些为收录的页面,我们有什么方法可以让他们重新进行收录呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1208
    • 旧文章不收录
  • 新站被快速收录的秘诀

    新站快速收录的方法

    新站被快速收录的秘诀,如何让新站快速的收录。如果你能做到下面这些,你的网站就可能在12个小时内被收录。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1506
    • 新站快速收录的方法
  • 如何快速提高网站收录

    快速收录,网站权重

    如何快速的提升网站的权重,哪些因素影响了网站的收录。但是网站权重不是一朝一夕就可以提升上来的,今天从几个重要点并且是力所能及的的点讲下如何提升网站的收录。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1101
    • 快速收录
    • 网站权重
  • 你的站点url中含有#号吗,别被坑惨了!

    #号,url链接

    如果一个在进行SEO优化的站点,url中却有#号,那么这就是一个悲伤的故事了,看完这篇文章你应该会跺脚!如果一条url链接中包含#符号,那么这条url就是一个 Fragment URL。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1642
    • #号
    • url链接
  • seo图片优化技巧

    图片优化技巧

    在做SEO优化的过程中,很多人都注重内容的优化,而图片在内容优化中起到了关键性的作用,做好图片的优化,不仅可以在展现的时候能展现,同时也能吸引用户的点击,带来更多的流量,不过由于搜索引擎暂时无法识别图片的内容,因此我们需要做好哪些操作来让搜索引擎更好的了解图片的内容并展现呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1720
    • 图片优化技巧
  • 新站排名不稳定的原因

    新站排名不稳定

    新站排名不稳定的原因,新站排名不稳定最基础的原因有两个,一是搜索引擎更新算法引起的影响,其实搜索引擎更新算法,不仅影响新站,老站也会被波及到。二是,新站本身权重都很低,搜索引擎对新站有一个观察前,前期信任度低。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2085
    • 新站排名不稳定
  • 如何鉴别真假蜘蛛,代码自动化

    蜘蛛鉴别,假爬虫屏蔽

    如何使用代码自动化的识别蜘蛛的真实性,防止被假蜘蛛抓取网站内容。分享一个通过代码自动化鉴别屏蔽加搜索引擎爬虫的思路。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1609
    • 蜘蛛鉴别
    • 假爬虫屏蔽
  • robots文件里该不该加上sitemap地址

    robots里放sitemap

    robots文件里该不该加上sitemap地址,有种说法就是搜索引擎抓取一个网站首先会抓取robots文件,这样把sitemap地址写在robots文件里,这样搜索引擎可以地址直接的对网站地图进行抓取,可以加快链接收录的速度,真相并不是这样

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2605
    • robots里放sitemap
  • site结果和网站权重有什么关系

    site命令,首页降权

    site域名不在首页就是网站被降权了吗果就把site首页不在第一位就来判断网站是否降权,那就太荒谬了。很多情况都出现site不在首页

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2580
    • site命令
    • 首页降权
  • seo中关键词筛选

    关键词优化

    关键词的选择非常的重要,知道如何从海量的关键词筛选出有价值的关键词对于SEO优化来说是至关重要的,关键词应该如何使筛选呢,才可以更好的满足搜索需求的同时满足SEO优化。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1344
    • 关键词优化
  • 伪静态和动态url的区别

    伪静态,动态页面

    网站优化只用静态还是动态链接,大家都为异口同声的说道,做SEO优化肯定要使用静态或者伪静态链接的,这样才利于搜索引擎的抓取;动态链接是很难被抓取收录的。难道动态链接真的就不能使用了吗?真的不能被收录吗?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1321
    • 伪静态
    • 动态页面
  • 如何防止网站内容被复制

    防止复制,js

    通过js修改document上的相关属性值来实,防止网站内容被复制。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1340
    • 防止复制
    • js
  • 网站标题关键词结构布局

    网站标题布局

    网站标题关键词结构布局,对于网站结构比较复杂的网站,那么为了使得网站结构有一定的条理性,那么这么网站的标题就需要一定的布局。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1473
    • 网站标题布局
  • 移动网站建设常见问题

    移动网站建设常见问题

    移动站点变得越来越重要,那么我们应该如何做好移动站呢。移动站点和PC站点相辅相成,都是一个互为补充的关系,少了任何一个都是不合理的,那么在移动站点的优化中常见的问题有哪些呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1720
    • 移动网站建设常见问题
  • SEO优化内容很重要

    SEO内容优化重要性

    SEO优化内容很重要,大部分注重的都是表面的优化,其实内容优化也是非常要重要的,经典名句“内容为王,外链为皇”,好的内容优化完全可以提高搜索排名!

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1365
    • SEO内容优化重要性
  • 带Nofollow标签的外链还有价值吗?

    nofollow,外链

    在 SEO(搜索引擎优化)的世界里,“外链”一直被视为网站权重和排名的重要因素之一。然而,当这些外链被加上rel="nofollow"标签时,这样的链接还有价值吗? 带Nofollow标签的外链毫无价值吗?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 336
    • nofollow
    • 外链