首页 >  SEO >  SEO知识 >  正文

造成百度spider抓取异常的原因

450

有一些网页,内容优质,用户也可以正常访问,但是Baiduspider却无法正常访问并抓取,造成搜索结果覆盖率缺失,对百度搜索引擎对站点都是一种损失,百度把这种情况叫“抓取异常”。对于大量内容无法正常抓取的网站,百度搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、排序上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。

下面向站长介绍一些常见的抓取异常原因:

1、服务器连接异常

服务器连接异常会有两种情况:一种是站点不稳定,Baiduspider尝试连接您网站的服务器时出现暂时无法连接的情况;一种是Baiduspider一直无法连接上您网站的服务器。
造成服务器连接异常的原因通常是您的网站服务器过大,超负荷运转。也有可能是您的网站运行不正常,请检查网站的web服务器(如apache、iis)是否安装且正常运行,并使用浏览器检查主要页面能否正常访问。您的网站和主机还可能阻止了Baiduspider的访问,您需要检查网站和主机的防火墙。

###2、网络运营商异常
网络运营商分电信和联通两种,Baiduspider通过电信或网通无法访问您的网站。如果出现这种情况,您需要与网络服务运营商进行联系,或者购买拥有双线服务的空间或者购买cdn服务。
抓取异常的原因

3、DNS异常

当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。

4、IP封禁

IP封禁为:限制网络的出口IP地址,禁止该IP段的使用者进行内容访问,在这里特指封禁了BaiduspiderIP。当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,请检查相关设置中是否误添加了BaiduspiderIP。也有可能是您网站所在的空间服务商把百度IP进行了封禁,这时您需要联系服务商更改设置。

5、UA封禁

UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份。当网站针对指定UA的访问,返回异常页面(如403,500)或跳转到其他页面的情况,即为UA封禁。当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,useragent相关的设置中是否有Baiduspider UA,并及时修改。

6、死链

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
对于死链,我们建议站点使用协议死链,并通过百度站长平台–死链工具向百度提交,以便百度更快地发现死链,减少死链对用户以及搜索引擎造成的负面影响。

7、异常跳转

将网络请求重新指向其他位置即为跳转。异常跳转指的是以下几种情况:
1)当前该页面为无效页面(内容已删除、死链等),直接跳转到前一目录或者首页,百度建议站长将该无效页面的入口超链接删除掉
2)跳转到出错或者无效页面
注意:对于长时间跳转到其他域名的情况,如网站更换域名,百度建议使用301跳转协议进行设置。

8、其他异常:

1)针对百度refer的异常:网页针对来自百度的refer返回不同于正常内容的行为。
2)针对百度ua的异常:网页对百度UA返回不同于页面原内容的行为。
3)JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。
4)压力过大引起的偶然封禁:百度会根据站点的规模、访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“Service Unavailable”),这样Baiduspider会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seozhishi/1060spider
相关文章
  • 哪些情况需要提交死链

    死链,404

    哪些行为会造成死链,哪些情况需要提交死链,如何正确的提交死链。​大量死链的存在容易造成搜索引擎对网站评级的降低,因为大量的死链接的存在,会对于用户访问时的体验造成严重的伤害。

    934
    • 死链
    • 404
  • 为什么网站关键词排名在第二页上去不

    排名怎么计算的,排名提升的原理,第二页的关键词如何提升排名

    为什么网站关键词排名在第二页上去不,这种情况一般是网站内容质量度不够,那么后续的SEO优化方向就要去提升站点的内容质量。揭秘排名计算的方式

    2078
    • 排名怎么计算的
    • 排名提升的原理
    • 第二页的关键词如何提升排名
  • AI搜索会替代搜索引擎吗?

    AI搜索,搜索引擎,seo

    各大搜索引擎公司确实在积极研发并推出基于人工智能(AI)的搜索功能,不仅能提供更准确、更个性化的搜索结果,还能够理解复杂的查询语句,甚至提供对话式的互动,使得搜索过程更加自然和高效,未来AI搜索会替代掉搜索引擎呢!

    772
    • AI搜索
    • 搜索引擎
    • seo
  • 事关转化,网站设计优化必须遵循的希克定律!

    希克定律,网站设计

    你知道吗,其实站点很多的流量都因为你不了解希克定律而流失了,不管你是通过SEO途径还是SEM等其它途径。很多时候最终是否能转化还是取决于站点给用户的感受。希克定律一个心理学上定律,是如何关联到网站的用户体验的。希克定律(Hick's Law)揭示了决策时间与选项数量之间的关系。

    529
    • 希克定律
    • 网站设计
  • 什么是网站权重,如何快速提升

    提升权重,

    相信SEO优化人员都是非常关注自己站点权重,更甚者有些公司招聘考核都是按照权重来的,对于这种行为我只能说非常的不专业。

    870
    • 提升权重
  • 关键词布局对SEO优化还有用吗?

    关键词,SEO

    说到SEO优化的操作就不得不提及关键词的布局以及外链建设,这是我们过去常见的操作入口,那么在如今的SEO优化场景下关键词布局对网站排名还有用吗?

    446
    • 关键词
    • SEO
  • 关键词排名波动原因

    排名波动原因

    理论上讲,关键词的排名决定了网站的流量,定期审查关键词的排名是每个SEO人员的工作,在以往的工作我们可能会遇到这样一种情况:关键词排名频繁波动,很不稳定。​它往往搞的SEOer一头雾水,明明没有过度优化,为什么还会出现这个问题?

    2094
    • 排名波动原因
  • 什么是反向链接,及其作用

    什么是反向链接

    什么是反向链接,及其作用对于SEO优化中起着什么作用呢?反向链接的种类非常的多,只要满足上述指向关系。比如常见的友情链接、网页目录、外部链接等等都可以认定是外链形式的反向链接。

    2354
    • 什么是反向链接
  • 如何安全增加关键词密度

    关键词密度

    那么在当今的算法下不能堆砌关键词,那么如何提升关键词的排名呢?不管算法怎么更新,关键词密度还是永远不变的本质,我们需要的是采用正确的方法提升关键词密度。

    1162
    • 关键词密度
  • 百度小程序权益配置-品牌关键词/官方认证

    百度小程序

    百度智能小程序核心页面关键词的避雷指南,品牌关键词/官方认证配置,什么是品牌关键词/官方认证、品牌关键词/官方认证配置方式、品牌关键词/官方认证配置常见问题、品牌关键词/官方认证配置优化建议。

    1075
    • 百度小程序
  • 手机移动端该怎么优化?

    手机移动端优化

    手机移动端该怎么优化?移动互联网的推出,各位站长也纷纷的挤入了移动化网站,移动网站可以说是一个比一个做的漂亮,那么既然做了移动化的网站,那少不了的自然是SEO优化,在PC端上你的网站可能在某个词上有排名,但在移动搜索引擎上,未必你会优先排名展现。

    1195
    • 手机移动端优化
  • 大多数站长搞错了SEO的核心

    SEO的核心,seo优化

    大家觉得SEO优化的核心重点是什么呢?关键词排名展现,如果您是这么认为的那请看完这篇文章,你会有不同的感悟。SEO的核心并不是在于关键词的排名,关键的排名只是途径。

    567
    • SEO的核心
    • seo优化
  • 用户喜欢的内容的样子,你知道吗

    SEO优化,用户喜欢的内容

    SEO优化回归本质是内容的优化,内容的核心是基于用户的需求,那么你了解用户吗?用户真正想要的内容是怎么样呢?当你搞明白了这个问题,相信对于的SEO优化会有很大的帮助。

    868
    • SEO优化
    • 用户喜欢的内容
  • 网站URL设计你做对了吗?收下这份攻略!

    URL设计,网站优化

    网站URL设计你真的会吗?合理的url设计不仅仅是对于用户体验和运营效果重要,对于seo优化也起到了非常重要的影响,在见过了各种的网站url设计模式,潘某人SEO结合自身多年SEO优化经验,给大家总结下,本人认为比较好的网站url设计的方案。

    801
    • URL设计
    • 网站优化
  • 手机网站的优化注意事项

    手机网站,移动端优化

    随着智能手机的崛起,移动互联网的占比越来越高,对于部门行业领域移动端已经吊打PC端,比如电商类的站点,大部门的成交都是在移动端完成的。因此,现在开始必须注重移动手机站点的优化。

    1081
    • 手机网站
    • 移动端优化
  • 如何一本正经的胡说八道,而你深信不疑

    确认偏误,认知闭合

    人们面对未知内容时选择相信的现象,是一个涉及心理学、社会学和认知科学的复杂议题。认知闭合需求、情感补偿机制、确认偏误、群体极化效应等诸多因素,有趣的可以进一步的去了解。那么我们又如如何抵御,避免自身陷入其中。做一个聪明人,有判断力的能人,自己可以不是那个胡说八道的人,但是决不能成为一本正经胡说八道的受众群体。

    471
    • 确认偏误
    • 认知闭合
  • 如何判断seo外包是否靠谱

    seo外包

    关键词有需求就有市场,尤其是seo优化市场可以说是鱼龙混杂,很多站点会去选择一些seo外包服务公司来助力公司的seo优化,今天就分享一点避坑指南,如何正确的选择seo外包。

    771
    • seo外包
  • 为什么搜索结果和点进去看的内容不一样

    User-Agent,搜索引擎

    有时候会遇到这种情况,在搜索引擎上找到了需要的内容,但是点击进去网站之后,发现和搜索引擎中的检索结果无关,甚至有的页面连主题都不相关。为什么会有这种情况出现呢?

    1765
    • User-Agent
    • 搜索引擎
-- 这已经是底线了,看看别的把! --