死链的正确处理方式,自动化提交,超详细全面教程!

死链提交是SEO优化中常见的一环,但是你处理死链的方式真的正确吗?可以说很多人并没有掌握正确的打开方式,今天潘某人SEO就分享一份详尽的死链处理方案教程,文章比较长,建议收藏保不齐哪一天就用的上了。

什么是死链

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链: 页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链: 服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。内容死链召回存在召回率的风险,所以一定记得要用协议死链的方式。

死链内容的来源

只有搞清楚死链的来源,才能避免遗漏,死链的来源多种多样,常见的有一下几种情况。
主动删除: 在站点运营的时候,难免会出现一些内容,因为各种原因,需要进行删除的。
程序错误: 在站点更新的时候,程序出现了吗bug,导致部分资源的访问出现了问题,导致出现一些意料之外的死链。
网站改版: 网站改版尤其是设计到结构上的改版,对网址路径也做了变更的时候,会出现一些死链;所以,一定记得要做新旧内容地址的301跳转。
网站被黑: 网站被黑,时常会被生成大量的垃圾页面,站点修复后,这类页面就会产生大量的死链。

死链如何正确处理

网站出现大量死链,会影响站点在搜索引擎的站点评级,所以及时正确的处理死链,对于SEO优化至关重要。
首先要确保内容的页面的TCP/HTTP协议明确表示页面是死链,也就是页面必须返回404(未找到)、403(禁止访问)、503(服务不可用)等;推荐使用页面返回404状态码。
很多站点做到这一步就结束了,这是不可取的,一定要主动去对应搜索引擎的站长后台提交死链。如果仅仅依靠搜索引擎的日常抓取发现死链,处理周期会非常的常,甚至会有遗漏。
就会导致还是有大量的死链内容继续参与展现,带来不好的用户体验,尤其是链接数量较多的情况,必然会被站点SEO造成负面影响。

哪些死链需要提交

并不是所有的死链需要在搜索引擎提交死链,仅仅需要提交一些已经被搜索引擎收录的内容或者可能被收录的内容的链接,很多时候收录在抓取之后需要一定周期。
但是对于一些原本就搜索引擎无法抓取的内容,如有访问权限的内容,或者是刚创建并且没有推送给搜索引擎抓取的内容,就没有提交的必要。
在实际操作中,无法挨个排查收录的情况,所以普遍的做法就是将搜索引擎有访问权限,可能被抓取到的都提交死链。

如何发现死链

对于一些自主删除的内容,这部分死链是非常清晰没有问题的,但是一些潜藏的死链,显然是无法直接预知的。这就需要在站点后端添加统计,对于返回404等状态码的页面路径进行记录;或者是定期分析网站日志对异常访问记录进行筛选处理。但是一般来说我们会发现一些大量404页面,并且并不是正常的路径。
那首先可能是一些恶意访问,暴力枚举刷后台的,这种不归于死链;但是反之如果是非常规的路径但是访问成功了,那么就要仔细排查了,网站是否被有被攻击。
对于一些符合路径规则的404访问,那就需要具体分析,虽然符合路径也有可能是一些恶意访问。最终需要的是符合站点路径规则的404页面,尤其是搜索引擎访问报错的链接,注重分辨真假蜘蛛。
对于网站被黑生成的链接,可以通过排除正常路径,获得所有链接的集合,来作为死链提交。

如何提交死链

不同的搜索引擎的站长工具,死链提交的工具会有差异,但是大致都是支持单链接提交和文件提交方式,少量的死链使用单链接提交,数量较多的死链使用文件提交,下面潘某人SEO就和大家看看国内常见搜索引擎的死链提交工具。

百度搜索引擎

百度死链提交工具
如上图是百度搜索资源平台的死链提交工具,提供了快速死链和普通死链两种方式,死链提交之后,百度蜘蛛抓取后,死链抓取状态可在提交列表中查看,死链抓取后生效时间为1周,如超时未生效依然是收录状态,可以在反馈中心提交反馈。
快速死链: 死链规则30天内提交数量上限为100条,超出范围的数据暂时无法提交。已生效数据记录仅在列表中保留30天,列表中规则总数小于100条时可以提交新规则。但是实际可以提交多少取决于账户的提交额度,会有所不同。
百度死链文件提交
普通死链: 文件地址格式为txt或xml,每个地址文件最多包含50000个网址且需小于10MB;不支持索引型sitemap;文件中只可包含该网站主域下的网址。在提交的时候选择正确的更新周期,取决于站点提交的死链文件的更新周期。如果只是偶尔提交死链,一定把抓取周期填久点,并且如上图所示的死链处理状态状态显示已删除之后之后及时删除提交的该条死链文件,避免重复无效的抓取。

360搜索引擎

360死链提交
360搜索引擎同样支持,单链接和文件提交两种方式,不同的是两者的提交入口是不区分的、公用的,在同一个位置提交死链地址,或者是死链文件地址,有更新相关的字段,但是没有对更新周期的描述。
死链文件,格式为txt或xml。如死链文件超过12个,以文件格式提交。

搜狗搜索引擎

搜狗死链提交
搜狗搜索引擎,同样的支持单链接和文件提交方式。与百度和360搜索引擎不同的是搜狗搜索引擎支持规则提交。
文件提交支持xml格式和TXT格式两种格式文件。规则提交则是以斜杠/或问号?两种形式结尾的死链规则形式提交死链前缀,下面有详细解释。
搜狗搜索引擎单个站点每日提交死链限额为100w条url,若超过限额则返回“超出限额”状态。文件提交中每个文件最多可包含50000个网址,并且文件应小于10MB,文件总个数不超过100个。
规则提交,支持目录规则和CGI规则,目录规则:以“/”结尾的前缀、CGI规则:以“?”结尾的前缀。
分别表示删除一个目录或者CGI形式的通配链接,例如:https://www.chateach.com/seo/ 表示将seo目录之下所有的链接作为死链提交;https://www.chateach.com/seo? 则表示将满足seo?*所有的链接作为死链提交,*号是通配符可以代表任何内容。
这个规则提交功能还是非常棒的,一条规则可以搞定,特别适合整个目录删除或者网站被黑有大量同目录的死链的情况。
但是需要注意的是如果当前目录提交死链之后,在提交之后有新的死链,则需重新提交死链规则,并且必须在上次提交之后的30天后重新提交。
如果提交的新规则,被已提交的规则所包含,则会被忽略,同样的需要在30天后再提交,才能被处理。

总结一下,三者都支持单链接和文件提交,搜狗搜索引擎额外的还支持规则提交。只有百度和搜狗搜索引擎可以对死链文件更新抓取,其中百度搜索引擎可以设置更新周期,搜狗搜索引擎无法设置更新周期;360搜索引擎无更新抓取功能,提交属于一次性的。

死链提交方案

设想是能实现自动化提交死链,避免繁杂的定期提交,由于只有百度搜索引擎能够定期抓取死链文件,因此自动提交死链接也就适用于百度和搜狗搜索引擎,360搜索引擎死链文件只能手动提交了。

文件格式

三者都可以使用文件提交方式,直接使用txt文件方式提交,内行一条链接,不超过50000条,并且文件大小不超过10M。如果超过那就需要分次提交或者分割成多个文件提交。

如果站点的死链提交频次不高,那么直接全部使用手动提交,更加的简单,没有必要整自动提交。将站点所有的死链,生成txt文件,防止网站更目录,然后直接提交对应的访问地址即可,注重不能有任何的访问权限限制。

自动提交实现

如果站点经常性会有死链生成,那么就可以使用自动提交方式,但是需要成本两份文件,一个用于百度和搜狗搜索引擎的自动更新抓取,另一个用于手动提交其它搜索引擎;但是百度和搜狗的更新抓取周期并不一致,为了减少等待周期,可以分为不同的两个文件单独处理。

在网站根目录下定时更新死链文件,注意不是实时更新,而是按照一定条件触发更新,可以以静态文件的形式。更新触发条件为,监控当前死链文件路径地址,被搜索引擎抓取时则进行死链文件的更新。

每次更新的时候,将上次文件中的链接,在数据库中标记为已处理的链接。每次更新的死链文件中只包含未提交过的链接。为了提高效率,如果当后台有新死链接生成的时候而搜索引擎还未进行本周期的抓取,可以直接追加到当前死链文件中。

结合站点死链生成的周期,在百度搜索引擎死链提交工具中设置对应的更新周期。如此所有引擎会定期抓取死链文件,站点监控到抓取,则标记当前文件的中的死链为已处理,把待处理的死链更新到文件中,周而复始的自动提交死链了。

对于无法自动更新抓取的搜索引擎,则另外生成一份死链文件,可以把时间周期调长。对比也可以加上搜索监控,逻辑按上述自动提交的一致,在被360搜索引擎抓取之后,标记已有数据为已处理同时将待提交的死链更新到死链文件,然后手动提交到死链工具中,然后也能实现半自动。

从此你就告别了,每次死链提交时,思考要如何获取哪些链接作为死链提交,踏入了自动和半自动提交死链的时代!

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用!

本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理

本文地址:https://www.chateach.com/seo/seozhishi/1075tijiao

相关文章

  • 网站排名优化贵在长期稳定坚持

    网站排名优化思路

    如果一个网站想要稳定的流量,那么不是靠一朝一夕可以迅速做到的,因此网站排名优化的重点在于长期稳定坚持的输出高质量的内容的,一个量变到质变的过程。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1614
    • 网站排名优化思路
  • 冷门关键词才是大多数网站的出路

    冷门关键词,网站优化

    对于很多站点尤其是新站经常会遇到不收录得问题,或者即使是收录了,排名也非常的不理想很难获得理想的流量,就有了一种SEO优化做不下去,想要放弃的感觉。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1130
    • 冷门关键词
    • 网站优化
  • 如何提高网站用户体验?

    网站用户体验

    如何提高网站用户体验?SEO优化中有一个奇怪的现象:关键词排名高,引流到站的访客需求精确,但跳出率高,转化低。这种现象是网站用户体验度低的表现,

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1091
    • 网站用户体验
  • SEO关键词优化策略

    关键词,SEO

    站点SEO关键词的优化策略应该是怎么样的。也许那个SEO从业者都有着不同看法对于这个问题,​大家SEO优化关键词的策略是怎么样的呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 897
    • 关键词
    • SEO
  • 网站SEO死链的如何处理

    死链,SEO

    大量死链的存在容易造成搜索引擎对网站评级的降低,因为大量的死链接的存在,会对于用户访问时的体验造成严重的伤害。同时大量的死链存在,会浪费大量的抓取量,对于网站的正常收录都会造成严重的影响。今天就和潘某人SEO一起探讨一下哪些情况需要提交死链、如何发现以及正确删除死链的方法。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 348
    • 死链
    • SEO
  • 多域名解析到同一网站利于排名吗?

    多域名解析

    多域名解析到同一个网站,个人觉得这种行为就是闲的,没事找事给自己挖坑。多域名解析到同一个网站,首先运营上的意义不大,并且非常容易出现重复收录,权重分散的问题,所以除非有迫不得已的原因,打死都不要去多域名解析到一个网站。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1247
    • 多域名解析
  • cms是什么意思

    cms系统,WordPress

    CMS是Content Management System的缩写,意为"内容管理系统"。 常见的CMS系统主要包括:帝国cms、织梦cms、phpcms、WordPress、Zblog等博客系统。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1120
    • cms系统
    • WordPress
  • 代码适配对百度友好代码详解

    代码适配

    移动端适配的方式有多种形式,比如通过规则适配、响应式、独立移动PC站等方式都可以实现PC移动端适配的效果,今天详细讲一下本人比较喜欢的适配方式即代码适配,这种适配方式可以说是尽可能的结合了上面集中适配方式的优点,对于SEO优化来说还是比较友好的。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2768
    • 代码适配
  • SEO中的权重你真的搞懂了吗

    权重,SEO

    权重对于SEO从业者来说可以说在熟悉不过了,很多时候被用来验证工作成果,虽然这种行为不科学,但是大家对于高权重的追求还是非常热衷的,但是你的对于权重全面的了解了吗?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1213
    • 权重
    • SEO
  • 什么是网站的抓取频次

    抓取频次,网站收录

    抓取频次是搜索引擎蜘蛛在单位时间内容访问网站的次数,比如在百度站长工具内容看到的抓取的频次都是按天进行统计的,那么数据中的抓取频次都是日抓取频次。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1552
    • 抓取频次
    • 网站收录
  • 想要做好网站seo优化内容,需要知道这几点

    seo优化,网站内容

    近年来网站seo优化越来越难做了,那是凡事都有双面性,网站seo优化越来越难,那么逐渐的会更多站点及优化人员逐渐的放弃被淘汰,这也正是大家机遇。如今很多人在唱衰seo,从相关的统计数据可以看到搜索引擎的用户量和搜索量依然强劲庞大,虽然说新媒体平台近几年的发展态势迅猛,但是需要知道此类流量性质和搜索引擎还是有很大区别的。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 887
    • seo优化
    • 网站内容
  • 权威性在百度搜索排名中的作用

    百度搜索,排名,权威性

    对于百度搜索引擎排名有一个非常重要的因素就是站点权威性,相信很多人对于权威性并不是非常的了解,今天我们就从百度搜索中的作用、什么是权威性、如何评估权威性和权威性之官方结果四个方面进行解读。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1906
    • 百度搜索
    • 排名
    • 权威性
  • 网站地图sitemap的注意事项

    sitemap注意事项,网站地图

    链接提交是站长们每天都会去做的事情,sitemap提交的注意事项,虽然说sitemap提交收录速度不是最快的,但是功能却是最强大的。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1223
    • sitemap注意事项
    • 网站地图
  • 链接权重分析HITS算法的不足之处

    HITS算法的不足之处,链接权重分析

    搜索引擎链接权重分析,主要参考。HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。HITS算法的不足之处,引用越多高质量页面的网页,其链接权威度越高。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2600
    • HITS算法的不足之处
    • 链接权重分析
  • SEO的优化效果如何检查

    SEO优化效果检查

    SEO优化不仅仅是权重,重点是在你的流量是有价值的可以带来转化的流量及关键词,大家可以参照下本文的SEO优化效果检查有哪些指标。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1869
    • SEO优化效果检查
  • 何为百度快照劫持,如何避免?

    百度快照劫持

    百度快照劫持是利用黑客技术拿到了你的ftp,或者应用网站漏洞,来篡改网站的网页内容,主要的通过在网页中插入js代码实现跳转,而当你检查网站代码的时候很难发现问题所在,如果没有一定的技术水平的情况下。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1358
    • 百度快照劫持
  • seo页面优化的常用技术

    seo页面优化的

    seo页面优化的常用技术,从核心关键词分析定位、网站目录和页面优化、标签优化技巧、利用好百度搜索资源平台、提高页面的附加价值、访客到客户的转化工作几个角度来讲下SEO页面优化的常用技术。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1580
    • seo页面优化的
  • 用户体验之页面加载速度与网络质量

    用户体验,页面加载速度

    如何提升页面的加载速度,一直以来忽略了很重要的一点,之前的优化基本上都是从站点的角度的出发,提升程序性能,增加配置,压缩资源等。网页加载速度不止是取决于服务器的响应速度,还与客户端有关。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1731
    • 用户体验
    • 页面加载速度