死链的正确处理方式,自动化提交,超详细全面教程!

死链提交是SEO优化中常见的一环,但是你处理死链的方式真的正确吗?可以说很多人并没有掌握正确的打开方式,今天潘某人SEO就分享一份详尽的死链处理方案教程,文章比较长,建议收藏保不齐哪一天就用的上了。

什么是死链

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链: 页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链: 服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。内容死链召回存在召回率的风险,所以一定记得要用协议死链的方式。

死链内容的来源

只有搞清楚死链的来源,才能避免遗漏,死链的来源多种多样,常见的有一下几种情况。
主动删除: 在站点运营的时候,难免会出现一些内容,因为各种原因,需要进行删除的。
程序错误: 在站点更新的时候,程序出现了吗bug,导致部分资源的访问出现了问题,导致出现一些意料之外的死链。
网站改版: 网站改版尤其是设计到结构上的改版,对网址路径也做了变更的时候,会出现一些死链;所以,一定记得要做新旧内容地址的301跳转。
网站被黑: 网站被黑,时常会被生成大量的垃圾页面,站点修复后,这类页面就会产生大量的死链。

死链如何正确处理

网站出现大量死链,会影响站点在搜索引擎的站点评级,所以及时正确的处理死链,对于SEO优化至关重要。
首先要确保内容的页面的TCP/HTTP协议明确表示页面是死链,也就是页面必须返回404(未找到)、403(禁止访问)、503(服务不可用)等;推荐使用页面返回404状态码。
很多站点做到这一步就结束了,这是不可取的,一定要主动去对应搜索引擎的站长后台提交死链。如果仅仅依靠搜索引擎的日常抓取发现死链,处理周期会非常的常,甚至会有遗漏。
就会导致还是有大量的死链内容继续参与展现,带来不好的用户体验,尤其是链接数量较多的情况,必然会被站点SEO造成负面影响。

哪些死链需要提交

并不是所有的死链需要在搜索引擎提交死链,仅仅需要提交一些已经被搜索引擎收录的内容或者可能被收录的内容的链接,很多时候收录在抓取之后需要一定周期。
但是对于一些原本就搜索引擎无法抓取的内容,如有访问权限的内容,或者是刚创建并且没有推送给搜索引擎抓取的内容,就没有提交的必要。
在实际操作中,无法挨个排查收录的情况,所以普遍的做法就是将搜索引擎有访问权限,可能被抓取到的都提交死链。

如何发现死链

对于一些自主删除的内容,这部分死链是非常清晰没有问题的,但是一些潜藏的死链,显然是无法直接预知的。这就需要在站点后端添加统计,对于返回404等状态码的页面路径进行记录;或者是定期分析网站日志对异常访问记录进行筛选处理。但是一般来说我们会发现一些大量404页面,并且并不是正常的路径。
那首先可能是一些恶意访问,暴力枚举刷后台的,这种不归于死链;但是反之如果是非常规的路径但是访问成功了,那么就要仔细排查了,网站是否被有被攻击。
对于一些符合路径规则的404访问,那就需要具体分析,虽然符合路径也有可能是一些恶意访问。最终需要的是符合站点路径规则的404页面,尤其是搜索引擎访问报错的链接,注重分辨真假蜘蛛。
对于网站被黑生成的链接,可以通过排除正常路径,获得所有链接的集合,来作为死链提交。

如何提交死链

不同的搜索引擎的站长工具,死链提交的工具会有差异,但是大致都是支持单链接提交和文件提交方式,少量的死链使用单链接提交,数量较多的死链使用文件提交,下面潘某人SEO就和大家看看国内常见搜索引擎的死链提交工具。

百度搜索引擎

百度死链提交工具
如上图是百度搜索资源平台的死链提交工具,提供了快速死链和普通死链两种方式,死链提交之后,百度蜘蛛抓取后,死链抓取状态可在提交列表中查看,死链抓取后生效时间为1周,如超时未生效依然是收录状态,可以在反馈中心提交反馈。
快速死链: 死链规则30天内提交数量上限为100条,超出范围的数据暂时无法提交。已生效数据记录仅在列表中保留30天,列表中规则总数小于100条时可以提交新规则。但是实际可以提交多少取决于账户的提交额度,会有所不同。
百度死链文件提交
普通死链: 文件地址格式为txt或xml,每个地址文件最多包含50000个网址且需小于10MB;不支持索引型sitemap;文件中只可包含该网站主域下的网址。在提交的时候选择正确的更新周期,取决于站点提交的死链文件的更新周期。如果只是偶尔提交死链,一定把抓取周期填久点,并且如上图所示的死链处理状态状态显示已删除之后之后及时删除提交的该条死链文件,避免重复无效的抓取。

360搜索引擎

360死链提交
360搜索引擎同样支持,单链接和文件提交两种方式,不同的是两者的提交入口是不区分的、公用的,在同一个位置提交死链地址,或者是死链文件地址,有更新相关的字段,但是没有对更新周期的描述。
死链文件,格式为txt或xml。如死链文件超过12个,以文件格式提交。

搜狗搜索引擎

搜狗死链提交
搜狗搜索引擎,同样的支持单链接和文件提交方式。与百度和360搜索引擎不同的是搜狗搜索引擎支持规则提交。
文件提交支持xml格式和TXT格式两种格式文件。规则提交则是以斜杠/或问号?两种形式结尾的死链规则形式提交死链前缀,下面有详细解释。
搜狗搜索引擎单个站点每日提交死链限额为100w条url,若超过限额则返回“超出限额”状态。文件提交中每个文件最多可包含50000个网址,并且文件应小于10MB,文件总个数不超过100个。
规则提交,支持目录规则和CGI规则,目录规则:以“/”结尾的前缀、CGI规则:以“?”结尾的前缀。
分别表示删除一个目录或者CGI形式的通配链接,例如:https://www.chateach.com/seo/ 表示将seo目录之下所有的链接作为死链提交;https://www.chateach.com/seo? 则表示将满足seo?*所有的链接作为死链提交,*号是通配符可以代表任何内容。
这个规则提交功能还是非常棒的,一条规则可以搞定,特别适合整个目录删除或者网站被黑有大量同目录的死链的情况。
但是需要注意的是如果当前目录提交死链之后,在提交之后有新的死链,则需重新提交死链规则,并且必须在上次提交之后的30天后重新提交。
如果提交的新规则,被已提交的规则所包含,则会被忽略,同样的需要在30天后再提交,才能被处理。

总结一下,三者都支持单链接和文件提交,搜狗搜索引擎额外的还支持规则提交。只有百度和搜狗搜索引擎可以对死链文件更新抓取,其中百度搜索引擎可以设置更新周期,搜狗搜索引擎无法设置更新周期;360搜索引擎无更新抓取功能,提交属于一次性的。

死链提交方案

设想是能实现自动化提交死链,避免繁杂的定期提交,由于只有百度搜索引擎能够定期抓取死链文件,因此自动提交死链接也就适用于百度和搜狗搜索引擎,360搜索引擎死链文件只能手动提交了。

文件格式

三者都可以使用文件提交方式,直接使用txt文件方式提交,内行一条链接,不超过50000条,并且文件大小不超过10M。如果超过那就需要分次提交或者分割成多个文件提交。

如果站点的死链提交频次不高,那么直接全部使用手动提交,更加的简单,没有必要整自动提交。将站点所有的死链,生成txt文件,防止网站更目录,然后直接提交对应的访问地址即可,注重不能有任何的访问权限限制。

自动提交实现

如果站点经常性会有死链生成,那么就可以使用自动提交方式,但是需要成本两份文件,一个用于百度和搜狗搜索引擎的自动更新抓取,另一个用于手动提交其它搜索引擎;但是百度和搜狗的更新抓取周期并不一致,为了减少等待周期,可以分为不同的两个文件单独处理。

在网站根目录下定时更新死链文件,注意不是实时更新,而是按照一定条件触发更新,可以以静态文件的形式。更新触发条件为,监控当前死链文件路径地址,被搜索引擎抓取时则进行死链文件的更新。

每次更新的时候,将上次文件中的链接,在数据库中标记为已处理的链接。每次更新的死链文件中只包含未提交过的链接。为了提高效率,如果当后台有新死链接生成的时候而搜索引擎还未进行本周期的抓取,可以直接追加到当前死链文件中。

结合站点死链生成的周期,在百度搜索引擎死链提交工具中设置对应的更新周期。如此所有引擎会定期抓取死链文件,站点监控到抓取,则标记当前文件的中的死链为已处理,把待处理的死链更新到文件中,周而复始的自动提交死链了。

对于无法自动更新抓取的搜索引擎,则另外生成一份死链文件,可以把时间周期调长。对比也可以加上搜索监控,逻辑按上述自动提交的一致,在被360搜索引擎抓取之后,标记已有数据为已处理同时将待提交的死链更新到死链文件,然后手动提交到死链工具中,然后也能实现半自动。

从此你就告别了,每次死链提交时,思考要如何获取哪些链接作为死链提交,踏入了自动和半自动提交死链的时代!

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用!

本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理

本文地址:https://www.chateach.com/seo/seozhishi/1075tijiao

相关文章

  • 百度快照更新时间的解析

    百度快照,快照时间更新

    百度快照时间更新和网站的权重是一个什么样的关系呢?很多站点一直的对于快照和权重的关系存在着误解。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1180
    • 百度快照
    • 快照时间更新
  • SEO必须了解这些h5标签,内含检测工具及方法

    h5标签

    HTML5标签对SEO的作用主要体现在内容语义化、结构优化、用户体验提升三个维度,通过帮助搜索引擎精准理解网页内容,提升页面在搜索结果中的可见性。通过系统化应用HTML5标签,可实现技术SEO与内容SEO的双重优化,显著提升网站在搜索引擎中的竞争力。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 5070
    • h5标签
  • 百度白杨算法解析

    白杨算法

    白杨算法”的作用:为更好满足川户地域化需求,也更好扶持各种地方特色类站点,百度移动搜索推出白杨算法,对符合百度地域优化标准的优质站点进行优先展现。“白杨算法”:为方便用户根据自身位置查找和使用本地信息与服务,帮助移动站点健康、稳定地提升流量,百度移动搜索现提供地域优化服务。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2014
    • 白杨算法
  • 已收录页面修改需要注意什么

    收录页面修改

    对于已收录页面大家是如何进行内容的修改呢?是直接在原文上修改,还是直接删除然后重新发布呢?如何操作才更利于SEO优化呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1092
    • 收录页面修改
  • 网站中毒被降权了怎么操作

    网站被黑中毒怎么优化

    网站中毒被降权了怎么操作,这种情况立即关闭网站,申请闭站保护,然后对网站进行全面的检查加固,沉淀1-6个月之后再重新上线。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1464
    • 网站被黑中毒怎么优化
  • 是什么在拉低阻碍站点的权重

    影响网站权重的因素

    分析下传统企业建站的站点有哪些问题是影响网站权重提升的因素。如果一个网站的结构上先天不足,那么对于后期优化真的是阻碍重重很折磨人......

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2309
    • 影响网站权重的因素
  • SEO的几个死穴

    SEO的死穴

    对于SEO工作来讲,我们都知道它是一个由多种因素组合成的排序系统,因而,我们在让网站排名靠前的过程中,就必须考虑诸多因素,例如:做外链,写高质量内容等等。但每一个人的時间终究有限,而对于一些中小企业来讲,它并不能创立更多的SEO团队,在一些优化策略的时候也许就会选择一些激进的方式,触碰到SEO的死穴。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1513
    • SEO的死穴
  • 建站系统搭建网站利于SEO优化吗?

    建站系统选择

    对于一般的企业建站为了便利性会选择使用建站系统来进行网站的搭建,但是使用建站系统却存在着很多问题,对于业务上或者SEO优化上都有着很大影响。然而对于中小企业使用建站系统模板来搭建系统主要还是成本、维护上上考虑,也是一种迫不得已的选择,那么使用建站系统建站我们需要避免那些问题呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1184
    • 建站系统选择
  • 老域名建站对seo真的有好处吗

    老域名建站,seo优化,新站考核期

    很多站点的时候会选用权重高的老域名,可以获得更好的效果,但是事实真的是这样吗?老域名建站大部分的情况下不但没有正向作用,还会有负面的作用,那么老域名建站需要注意哪些方面呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1158
    • 老域名建站
    • seo优化
    • 新站考核期
  • SEO优化还值得做吗

    SEO优化

    SEO优化还值得做吗?可以说SEO优化越来越难做,对于企业优化的成本越来越多,对于个人站长,通过网站赚钱的可能性也越来越小。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1137
    • SEO优化
  • 百度抓取频率高代表什么,如何调整

    抓取频率调整

    百度蜘蛛抓取频次是根据网站的内容量来的,简单的来说,如果网站的内容多那么抓取频次就高;如果网站的内容少,那么百度抓取的频次就低。百度抓取频率高代表什么,如何调整?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 3796
    • 抓取频率调整
  • 事关转化,网站设计优化必须遵循的希克定律!

    希克定律,网站设计

    你知道吗,其实站点很多的流量都因为你不了解希克定律而流失了,不管你是通过SEO途径还是SEM等其它途径。很多时候最终是否能转化还是取决于站点给用户的感受。希克定律一个心理学上定律,是如何关联到网站的用户体验的。希克定律(Hick's Law)揭示了决策时间与选项数量之间的关系。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 5249
    • 希克定律
    • 网站设计
  • 网站被镜像,如何向百度反馈?

    网站被镜像

    最近收到不少站长反馈被镜像的问题,网站被镜像后,站点流量、关键词都会受到影响,是很多网站深恶痛绝的现象,站长通过禁止正文被粘贴、禁止镜像站IP都无法彻底杜绝被镜像现象。被镜像该如何维权,学堂君整理以下投诉攻略:

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1065
    • 网站被镜像
  • 关注网站抓取频率的重要性

    网站抓取频率

    关注网站抓取频率的重要性,每天都会有数以万计的url被搜素引擎抓取,而形成的相互的链接,而构成了我们所看到的互联网,对于网站优化来讲,就是网站抓取频率,那网站抓取频率对seo有哪些重要的意义呢?下面我们来看看为什么要关注网站抓取频率。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2489
    • 网站抓取频率
  • 网站如何让百度快速收录

    百度快速收录,秒收录

    如何优化才能让搜索引擎快速收录网站内容,分享一个可以做到秒收录的方案,如何让页面快速收录是站长们一直在做的事情,今天来讲一下如何实现内容秒收录。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1170
    • 百度快速收录
    • 秒收录
  • 百度内容发布时间的重要性

    快照时间,内容发布时间

    为什么搜索结果页的快照时间修改为了内容发布时间。内容发布时间对于网站的排名又有什么样的影响呢?网页内容的产生时间更精准的告知用户,降低用户选择成本,提升点击效率,同时也能够提升网站的转化率。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1518
    • 快照时间
    • 内容发布时间
  • 百度搜索算法大全,站长速度查阅收藏

    百度搜索算法

    百度搜索算法大全,百度算法主要从:页面内容质量、用户需求满足、用户体验友好、搜索公正及用户安全,今天给大家梳理下这四块内容下涉及到的算法。作为seo优化从业者必须掌握的搜索引擎的算法,梳理一下百度搜索引擎常见的算法。飓风算法、劲风算法、细雨算法、蓝天算法、冰桶算法、惊雷算法、清风算法

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2219
    • 百度搜索算法
  • 网站标题关键词结构布局

    网站标题布局

    网站标题关键词结构布局,对于网站结构比较复杂的网站,那么为了使得网站结构有一定的条理性,那么这么网站的标题就需要一定的布局。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1572
    • 网站标题布局