造成百度spider抓取异常的原因

有一些网页,内容优质,用户也可以正常访问,但是Baiduspider却无法正常访问并抓取,造成搜索结果覆盖率缺失,对百度搜索引擎对站点都是一种损失,百度把这种情况叫“抓取异常”。对于大量内容无法正常抓取的网站,百度搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、排序上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。

下面向站长介绍一些常见的抓取异常原因:

1、服务器连接异常

服务器连接异常会有两种情况:一种是站点不稳定,Baiduspider尝试连接您网站的服务器时出现暂时无法连接的情况;一种是Baiduspider一直无法连接上您网站的服务器。
造成服务器连接异常的原因通常是您的网站服务器过大,超负荷运转。也有可能是您的网站运行不正常,请检查网站的web服务器(如apache、iis)是否安装且正常运行,并使用浏览器检查主要页面能否正常访问。您的网站和主机还可能阻止了Baiduspider的访问,您需要检查网站和主机的防火墙。

###2、网络运营商异常
网络运营商分电信和联通两种,Baiduspider通过电信或网通无法访问您的网站。如果出现这种情况,您需要与网络服务运营商进行联系,或者购买拥有双线服务的空间或者购买cdn服务。
抓取异常的原因

3、DNS异常

当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。

4、IP封禁

IP封禁为:限制网络的出口IP地址,禁止该IP段的使用者进行内容访问,在这里特指封禁了BaiduspiderIP。当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,请检查相关设置中是否误添加了BaiduspiderIP。也有可能是您网站所在的空间服务商把百度IP进行了封禁,这时您需要联系服务商更改设置。

5、UA封禁

UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份。当网站针对指定UA的访问,返回异常页面(如403,500)或跳转到其他页面的情况,即为UA封禁。当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,useragent相关的设置中是否有Baiduspider UA,并及时修改。

6、死链

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
对于死链,我们建议站点使用协议死链,并通过百度站长平台–死链工具向百度提交,以便百度更快地发现死链,减少死链对用户以及搜索引擎造成的负面影响。

7、异常跳转

将网络请求重新指向其他位置即为跳转。异常跳转指的是以下几种情况:
1)当前该页面为无效页面(内容已删除、死链等),直接跳转到前一目录或者首页,百度建议站长将该无效页面的入口超链接删除掉
2)跳转到出错或者无效页面
注意:对于长时间跳转到其他域名的情况,如网站更换域名,百度建议使用301跳转协议进行设置。

8、其他异常:

1)针对百度refer的异常:网页针对来自百度的refer返回不同于正常内容的行为。
2)针对百度ua的异常:网页对百度UA返回不同于页面原内容的行为。
3)JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。
4)压力过大引起的偶然封禁:百度会根据站点的规模、访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“Service Unavailable”),这样Baiduspider会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用!

本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理

本文地址:https://www.chateach.com/seo/seozhishi/1060spider

相关文章

  • 如何让搜索引擎识别页面是PC还是移动端

    SEO页面类型识别

    如何让搜索引擎识别页面是PC还是移动端,让蜘蛛有效的识别页面类型,可以使得抓取更有效率,同时给用户在不同设备访问时,给到正确的对应页面,提升用户体验。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 3005
    • SEO页面类型识别
  • SEO关键词优化策略

    关键词,SEO

    站点SEO关键词的优化策略应该是怎么样的。也许那个SEO从业者都有着不同看法对于这个问题,​大家SEO优化关键词的策略是怎么样的呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 667
    • 关键词
    • SEO
  • HTML5标签让你的内容在搜索引擎中脱颖而出

    HTML5,语义化标签

    HTML5标签的正确使用不仅能够提升文章的结构清晰度,还能增强内容的可读性和搜索引擎的友好性。HTML5引入了许多新的语义化标签,这些标签帮助搜索引擎更好地理解网页的结构和内容。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 450
    • HTML5
    • 语义化标签
  • 是什么在拉低阻碍站点的权重

    影响网站权重的因素

    分析下传统企业建站的站点有哪些问题是影响网站权重提升的因素。如果一个网站的结构上先天不足,那么对于后期优化真的是阻碍重重很折磨人......

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2082
    • 影响网站权重的因素
  • robots文件有什么用

    robots有什么作用

    robots文件作用对于SEO优化不可忽视给i,可以有效提高网站内容的质量减少重复收录,保护隐私数据不被抓取!

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1726
    • robots有什么作用
  • 域名转移怎么操作

    域名转移怎么操作

    域名对于网站优化来说是十分重要的,因此保持域名的稳定对于SEO优化来说至关重要。我们应该对自己的域名进行集中管理。那么这里就要涉及到域名的转移过户,这种情况分为两种。一种是账户转移,一种是夸服务商转移。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2090
    • 域名转移怎么操作
  • 搜索引擎抓取系统概述

    搜索引擎,蜘蛛

    今天就给大家简单的介绍一下搜索引擎系统大致工作原理,内容比较多会分几次更新,大家记得关注“潘某人SEO”坐等更新。先给大家介绍下搜索引擎的基础知识:抓取系统基本框架、抓取中涉及的网络协议、抓取的基本过程三部分。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1142
    • 搜索引擎
    • 蜘蛛
  • MIP Cache 服务下线通知

    MIP Cache关闭

    MIP Cache 服务下线通知,MIP Cache 服务至目前为止已上线了三年多,为 Web 生态输出了优质资源和更为快速的网页浏览体验。2020年6月1日 - 2020年6月30日:关闭站长平台 MIP 入口,逐步清退下线 MIP Cache 服务。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1956
    • MIP Cache关闭
  • 如何防止网站内容被采集保护原创

    防爬取,原创保护,防采集

    分享一个值得一看的保护内容被恶意抓取采集的方案,如何更高效率的从源头解决网站内容被采集,保护站点原创收录排名。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1888
    • 防爬取
    • 原创保护
    • 防采集
  • 百度SEO抓取友好性之链接发现

    百度SEO,链接提交

    ​当网站有了内容,要实现内容的收录,就需要先实现内容被搜索引擎抓取,而要实现抓取就可以让搜索引擎发现链接。对于常见搜索引擎,发现链接的方式主要有两种方式,一种是抓取获取,一种是站点的提交。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 691
    • 百度SEO
    • 链接提交
  • 网站页面质量对seo优化的影响

    面质量对优化的影响

    这是一个值得思考的问题,网站页面质量对seo优化的影响有哪些呢?单页的内容是组成整个网站的单体,页面的质量因此也代表了整个网站内容的质量。页面质量主要可以从内容质量、用户体验上进行评判。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 922
    • 面质量对优化的影响
  • 新人小白如何学好SEO

    小白SEO,学好SEO

    看到网上很多给小白们整理规定的新人必备的教程,只能说讲得很好,但是并非是新人SEO小白必备的。SEO优化说简单也简单,说复杂又很复杂,很多教程拿出SEO优化的几个点重要点一梳理一份小白需要的教程就出来了,这个不是在坑人么。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 672
    • 小白SEO
    • 学好SEO
  • 链接权重分析HITS算法的不足之处

    HITS算法的不足之处,链接权重分析

    搜索引擎链接权重分析,主要参考。HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。HITS算法的不足之处,引用越多高质量页面的网页,其链接权威度越高。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2381
    • HITS算法的不足之处
    • 链接权重分析
  • seo地域标签添加方法

    seo地域展现

    通过seo地域标签添加方法,精准的展现在我们需要的地域,城市进行展现,可以解决很多公司业务是具有地域性的特点,业务的目标客户集中在某些地域的问题,实现更加精准的推广营销。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1661
    • seo地域展现
  • 移动网页怎么快速排名

    移动排名优化

    移动网页怎么快速排名?从移动网站准备阶断、移动页面细节把握、搜索引擎工具这三方来讲下如何对于移动端的优化。为了让移动页面有较好的收录,在网站准备阶断就要进行考虑。首先,移动网站与pc网站一样,选择简短、易懂、注册年限较长的域名有利于搜索引擎收录。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1221
    • 移动排名优化
  • SEO网站内容一直不收录原因及解决方案

    不收录原因,SEO

    ​不收录原因及解决方案,自从2022年开始普遍可以感受到网站收录难、收录周期长。可以说让众多SEO从业者游走在失业的边缘。影响网站收录的原因很多,比如站点违规降权等因素,但是对于大多数的站点更多的还是由于内容的问题导致的收录问题。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 3975
    • 不收录原因
    • SEO
  • seo的就业前景怎么样

    SEO就业前景

    seo优化就业前景如何呢?对于刚入踏入SEO优化领域的小伙伴们最关心的就是就业前景怎么,适不适合长期发展?今天给大家解析一下,SEO行业到底适合进入吗?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 974
    • SEO就业前景
  • 同一台服务器多个网站会影响SEO吗?

    服务器多个网站

    对小型站点使用独立服务器的成本会有点高,尤其是网站前期流量不大的时候,使用虚拟服务器就足够应付了。同一个服务器部署很多站点,是否回被判断为群站被惩罚,导致SEO优化效果不佳呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 819
    • 服务器多个网站