首页 >  SEO >  SEO知识 >  正文

抓取角度分析百度不收录原因

 作者:潘某人SEO
1438

网站不收录的原因有很多,今天从蜘蛛抓取角度分析下造成不收录的原因有哪些,我们以百度搜索引擎为例来进行分析。收录的第一步是内容被抓取,如果抓取出现问题,那么其它收录因素做的再好也是徒劳的,很多站点收录不理想的原因正是在这个抓取环节出了问题。

百度spider抓取途径

一种是主动发现抓取,对于已经收录的站点,百度蜘蛛会根据站点的质量以及内容的时效性和更新速度,对网站进行定时的抓取,及时的发现新内容进行收录。但是很多站点的结构布局上很有问题,无法向蜘蛛提供一个新资源的入口,无法及时的发现所有的新内容。

网站的首页是非常的重要的,蜘蛛访问网站的第一步就是抓取首页,所以在首页上列出最新更新的资源;其次就是栏目页,各个栏目的更新的内容可以根据时间倒叙显示。这样一来百度蜘蛛只要抓取首页以及各个栏目就可以快速的抓取到全站的新内容。

百度不收录原因

一种是站点提交链接,对于很多站点网站结构不合理的就可以通过主动提交链接方式去弥补不足,对于百度搜索引擎可以通过sitemap提交、手动提交、API提交的方式提交URL,来实现让蜘蛛快速发现链接。

即使网站的结构合理,但是搜索引擎每日要处理海量的数据,因此主动提交链接还是非常有必要的,可以缩短抓取的时间,保护内容的原创权益。

抓取失败的原因

很多站点的收录问题不仅仅是因为上面的抓取不及时问题,而是连正常的抓取都出现了问题,一般常见造成抓取失败的原因:

1、robots封禁问题,有些站点会存在robots文件配置错误导致无法抓取,对于这种情况,可以在百度搜索资源平台的robots根据里测试链接的抓取权限来确认下配置的正确性。

2、状态码错误,对于搜索引擎来说正常页面需要返回的状态是200,其余的状态码对于收录都会造成影响,尤其是404状态码出现是绝对不会收录。

3、响应时间,想要一个好的收录那么网站的加载速度一定要够快,如果服务器响应过慢,当蜘蛛来抓取的时候因为响应超时就会终止对页面的抓取。合理的抓取时间是控制在1500ms以内,如果站点的抓取长期存在抓取超时问题,百度蜘蛛会降低抓取频次来降低服务器的压力。

4、抓取限制,检查站长后台是否设置了抓取上限限制,合理的设置抓取上线可以保证服务器的稳定性,但是最好还是不要进行上限设置,抓取频次难得可贵,在正常的抓取频次下,还是进行服务器的升级来满足抓取压力。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seozhishi/693
相关文章
  • 网站如何制作才会被百度收录?

    网站内容规划

    网站如何制作才会被百度收录? 新网站建设成功后,只有在百度等大型网站被审核认可后,才能被其他人搜索,所以如何使百度收录成为一个非常重要的问题

    2258
    • 网站内容规划
  • 百度收录速度与网站权重的关系

    权重与收录速度

    百度收录速度与网站权重的关系?网站权重越高是不是收录速度就越快,是不是只要网站权重足够高网站内容就可以做到秒收录呢?对于新站来说低权重站点是不是就无法做到内容的快速收录呢?

    1242
    • 权重与收录速度
  • 如何防止假蜘蛛抓取内容

    假蜘蛛,防采集,原创保护

    如何让网站自动识别蜘蛛的真假,如何自动的屏蔽假蜘蛛抓取网站内容,从而更好的保护网站的原创内容呢?

    1982
    • 假蜘蛛
    • 防采集
    • 原创保护
  • SEO如何屏蔽蜘蛛抓取,你掌握了哪些多少种!

    蜘蛛

    在SEO优化中有很多情况需要对蜘蛛进行屏蔽,那么作为一个SEO就必须知道屏蔽搜索引擎蜘蛛的常见方案,以及结合实践采用正确的方法来屏蔽蜘蛛。

    461
    • 蜘蛛
  • 收录工具常见问题解析

    收录工具

    今天讲一下百度收录工具那些事,今年百度搜索引擎的收录工具发生很大的变化。首先自动提交功能下线了,手动提交不再支持未认证站点链接的提交,sitemap不再支持索引型,并且每日提交的数量也有了限制。

    1301
    • 收录工具
  • 百度快照与权重的关系

    权重,百度快照

    百度快照与权重的关系,事实上百度快照并不能反映出搜索引擎蜘蛛抓取网站数据的时间,更不能决定页面的权重。所以大家不必过度的关注百度快照

    1471
    • 权重
    • 百度快照
  • 百度抓取频率高代表什么,如何调整

    抓取频率调整

    百度蜘蛛抓取频次是根据网站的内容量来的,简单的来说,如果网站的内容多那么抓取频次就高;如果网站的内容少,那么百度抓取的频次就低。百度抓取频率高代表什么,如何调整?

    3431
    • 抓取频率调整
  • 如何鉴别真假蜘蛛,代码自动化

    蜘蛛鉴别,假爬虫屏蔽

    如何使用代码自动化的识别蜘蛛的真实性,防止被假蜘蛛抓取网站内容。分享一个通过代码自动化鉴别屏蔽加搜索引擎爬虫的思路。

    1451
    • 蜘蛛鉴别
    • 假爬虫屏蔽
  • 新站SEO关注哪些数据

    新站优化数据指标

    一个新站的优化我们应该关注哪些数据来判定站点目前处于一个什么样的情况。对于新站来说我们迫切希望的是可以快速的获取排名权重,但是我们又可以通过哪些数据来分析优化流程是否有问题,是否是一个正常的发展呢?

    2558
    • 新站优化数据指标
  • SEO优化还值得做吗,为什么没有效果

    SEO优化,自媒体,优化效果

    SEO优化还值得做吗?为什么要继续坚持做SEO优化和为了SEO没效果这两个关键点分析一下。关键点从来不是SEO没有流量,而是你获取不到一个好的效果。

    786
    • SEO优化
    • 自媒体
    • 优化效果
  • 用户喜欢的内容的样子,你知道吗

    SEO优化,用户喜欢的内容

    SEO优化回归本质是内容的优化,内容的核心是基于用户的需求,那么你了解用户吗?用户真正想要的内容是怎么样呢?当你搞明白了这个问题,相信对于的SEO优化会有很大的帮助。

    888
    • SEO优化
    • 用户喜欢的内容
  • 新站被快速收录的秘诀

    新站快速收录的方法

    新站被快速收录的秘诀,如何让新站快速的收录。如果你能做到下面这些,你的网站就可能在12个小时内被收录。

    1372
    • 新站快速收录的方法
  • 移动端SEO优化应该怎么做呢?

    移动SEO优化

    移动端SEO优化应该怎么做呢?移动时代已经到来,并没有给人们太多思考时间,而越来越多的用户通过手机进行社交、查看新闻、移动办公及浏览网页等,随着移动营销被推上风口浪尖,众多企业开始转向移动SEO,纷纷试水移动搜索引擎优化。

    1817
    • 移动SEO优化
  • seo网站排名优化常见的误区

    seo优化误区,索引量,外链

    很多站点优化的时候对于网站收录量、流量以及外链的相关知识的了解很片面。导致了优化方向中出现了严重的偏插。

    1125
    • seo优化误区
    • 索引量
    • 外链
  • SEO优化中常见的问题,你中了几个?

    SEO优化

    在做SEO的过程中,还有几个最常见的问题,问题不大影响却不小,下面列举几个经常在网站优化中忽略而犯的错误,看看你中了个!

    679
    • SEO优化
  • 百度索引量与收录量,两者有什么不同

    百度索引量,收录量

    在讲索引量和收录量的时候,就不得不反问下大家你真知道什么是收录吗?可以说大多数人对于收录的认知是错误,存在索引和收录概念混淆的情况。

    1207
    • 百度索引量
    • 收录量
  • SEO优化的常规策略

    SEO优化策略

    凡事都先要有计划,对于SEO优化首先要确立站点的优化策略和方针,劲往一处使才可以更快获得更好的效果。今天我们就来说一下如何正确的选择优化策略,避免走弯路,好的开始是成功的一半,走错方向越努力离成功就越远。

    700
    • SEO优化策略
  • SEO优化内容应该走心还是走量

    SEO优化,内容数量质量

    SEO优化内容应该应该注重内容质量还是内容数量,作为SEO一员的你肯定会困扰于,索引量上不去,展现低,流量不理想会。不管怎么做就是没有明显改变,那么希望这篇文章可以帮助到你。

    547
    • SEO优化
    • 内容数量质量
-- 这已经是底线了,看看别的把! --