首页 >  SEO >  SEO知识 >  正文

抓取角度分析百度不收录原因

 作者:潘某人SEO
982

网站不收录的原因有很多,今天从蜘蛛抓取角度分析下造成不收录的原因有哪些,我们以百度搜索引擎为例来进行分析。收录的第一步是内容被抓取,如果抓取出现问题,那么其它收录因素做的再好也是徒劳的,很多站点收录不理想的原因正是在这个抓取环节出了问题。

百度spider抓取途径

一种是主动发现抓取,对于已经收录的站点,百度蜘蛛会根据站点的质量以及内容的时效性和更新速度,对网站进行定时的抓取,及时的发现新内容进行收录。但是很多站点的结构布局上很有问题,无法向蜘蛛提供一个新资源的入口,无法及时的发现所有的新内容。

网站的首页是非常的重要的,蜘蛛访问网站的第一步就是抓取首页,所以在首页上列出最新更新的资源;其次就是栏目页,各个栏目的更新的内容可以根据时间倒叙显示。这样一来百度蜘蛛只要抓取首页以及各个栏目就可以快速的抓取到全站的新内容。

百度不收录原因

一种是站点提交链接,对于很多站点网站结构不合理的就可以通过主动提交链接方式去弥补不足,对于百度搜索引擎可以通过sitemap提交、手动提交、API提交的方式提交URL,来实现让蜘蛛快速发现链接。

即使网站的结构合理,但是搜索引擎每日要处理海量的数据,因此主动提交链接还是非常有必要的,可以缩短抓取的时间,保护内容的原创权益。

抓取失败的原因

很多站点的收录问题不仅仅是因为上面的抓取不及时问题,而是连正常的抓取都出现了问题,一般常见造成抓取失败的原因:

1、robots封禁问题,有些站点会存在robots文件配置错误导致无法抓取,对于这种情况,可以在百度搜索资源平台的robots根据里测试链接的抓取权限来确认下配置的正确性。

2、状态码错误,对于搜索引擎来说正常页面需要返回的状态是200,其余的状态码对于收录都会造成影响,尤其是404状态码出现是绝对不会收录。

3、响应时间,想要一个好的收录那么网站的加载速度一定要够快,如果服务器响应过慢,当蜘蛛来抓取的时候因为响应超时就会终止对页面的抓取。合理的抓取时间是控制在1500ms以内,如果站点的抓取长期存在抓取超时问题,百度蜘蛛会降低抓取频次来降低服务器的压力。

4、抓取限制,检查站长后台是否设置了抓取上限限制,合理的设置抓取上线可以保证服务器的稳定性,但是最好还是不要进行上限设置,抓取频次难得可贵,在正常的抓取频次下,还是进行服务器的升级来满足抓取压力。

公众号
潘某人SEO 关注我每天学习SEO优化相关知识... 470篇原创内容
潘某SEO 公众号
申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于CC0协议或已获得VRF授权的图库站点 版权申明:本文为博主原创,未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本文地址:https://www.chateach.com/seo/seozhishi/693
相关文章
  • 网站如何制作才会被百度收录?

    网站内容规划

    网站如何制作才会被百度收录? 新网站建设成功后,只有在百度等大型网站被审核认可后,才能被其他人搜索,所以如何使百度收录成为一个非常重要的问题

    1892
    • 网站内容规划
  • 百度收录速度与网站权重的关系

    权重与收录速度

    百度收录速度与网站权重的关系?网站权重越高是不是收录速度就越快,是不是只要网站权重足够高网站内容就可以做到秒收录呢?对于新站来说低权重站点是不是就无法做到内容的快速收录呢?

    775
    • 权重与收录速度
  • 如何防止假蜘蛛抓取内容

    假蜘蛛,防采集,原创保护

    如何让网站自动识别蜘蛛的真假,如何自动的屏蔽假蜘蛛抓取网站内容,从而更好的保护网站的原创内容呢?

    1099
    • 假蜘蛛
    • 防采集
    • 原创保护
  • 收录工具常见问题解析

    收录工具

    今天讲一下百度收录工具那些事,今年百度搜索引擎的收录工具发生很大的变化。首先自动提交功能下线了,手动提交不再支持未认证站点链接的提交,sitemap不再支持索引型,并且每日提交的数量也有了限制。

    944
    • 收录工具
  • 百度快照与权重的关系

    权重,百度快照

    百度快照与权重的关系,事实上百度快照并不能反映出搜索引擎蜘蛛抓取网站数据的时间,更不能决定页面的权重。所以大家不必过度的关注百度快照

    1068
    • 权重
    • 百度快照
  • 百度抓取频率高代表什么,如何调整

    抓取频率调整

    百度蜘蛛抓取频次是根据网站的内容量来的,简单的来说,如果网站的内容多那么抓取频次就高;如果网站的内容少,那么百度抓取的频次就低。百度抓取频率高代表什么,如何调整?

    2708
    • 抓取频率调整
  • 如何鉴别真假蜘蛛,代码自动化

    蜘蛛鉴别,假爬虫屏蔽

    如何使用代码自动化的识别蜘蛛的真实性,防止被假蜘蛛抓取网站内容。分享一个通过代码自动化鉴别屏蔽加搜索引擎爬虫的思路。

    920
    • 蜘蛛鉴别
    • 假爬虫屏蔽
  • 快去看看API主动推送被降额了吗

    API主动推送,降额

    最近在论坛里看到很多站点的百度API主动推送额度被下调到了100条。这向站长们发送了什么样的信息呢?又意味着什么?

    1520
    • API主动推送
    • 降额
  • 网页内容大小影响收录吗

    网页收录,网页大小

    收录是站长们关心的问题,那么你觉得网页的大小会影响页面的收录吗?大多数的观点是认为字数一定要多,字数太少会导致内容质量低下,不容易收录。

    504
    • 网页收录
    • 网页大小
  • 网站改版如何降低对于seo优化的影响

    网站改版,seo优化的影响

    网站改版如何降低对于seo优化的在站点的实际运营中,网站的改版基本上是不可避免的,网站改版对于seo优化的影响相当于是一个未知数,很多的时候都超出了我们的预期。网站改版分为两种,一种是结构上的改版,一种是板式上的改版。

    351
    • 网站改版
    • seo优化的影响
  • 别让推广追踪url链接毁了你的SEO

    追踪链接,跟踪链接

    推广追踪url链接也就是我们常说的跟踪链接,它可以帮助我们实现对于广告投放效果的追踪。不管是常见SEM推广,其它的推广方式都需要用到跟踪链接,但是很多站点没有正确的使用,不知不觉中对站点的SEO已经造成了不利的影响。

    361
    • 追踪链接
    • 跟踪链接
  • SEO网站优化的作用

    网站优化的作用

    很多人也许听说过SEO,但这些人却不一定了解SEO的作用,SEO优化有什么价值呢,能给一个企业带来什么呢?可以有效的为企业降低推广成本的同时,又可以获得更多的成交。

    797
    • 网站优化的作用
  • 百度统计事件跟踪怎么添加

    百度统计事件跟踪,_trackEvent

    百度统计事件跟踪_trackEvent怎么添加使用,以一个页面点击的追踪统计作为一个例子。来演示下如何部署使用百度统计的事件分析js-api接口。学会合理利用事件分析功能,会对数据统计的灵活度有很大的提升,不仅对于SEO优化,网站的转化优化都可以提供强有力的支持。

    1884
    • 百度统计事件跟踪
    • _trackEvent
  • 百度快照对排名的影响

    快照排名的关系

    百度快照是搜索引擎在抓取页面时候,保留的一份纯文本文档。就是当网站无法访问的时候,访客可以通过快照了解页面的基本的内容;或者说你当前的网络环境很差的时候,因为百度快照是一个纯文本内容,你可以在网络速度极慢的时候还是可以顺利的打开快照页面。

    879
    • 快照排名的关系
  • robots协议不生效怎么处理

    robots

    为什么明明已经设正确设置的robots的屏蔽规则,但是就是不生效导致不该收录的内容被收录了呢?

    244
    • robots
  • 代码适配对百度友好代码详解

    代码适配

    移动端适配的方式有多种形式,比如通过规则适配、响应式、独立移动PC站等方式都可以实现PC移动端适配的效果,今天详细讲一下本人比较喜欢的适配方式即代码适配,这种适配方式可以说是尽可能的结合了上面集中适配方式的优点,对于SEO优化来说还是比较友好的。

    2053
    • 代码适配
  • 为什么大多数站点SEO以失败告终

    SEO失败原因,核心因素

    做SEO优化的站点很多,从事SEO行业的人也不少;但是成功的站点没几个,SEO高手没几个。那么到底是什么原因导致了大多数站点的SEO优化没有效果,都以失败告终了呢?

    739
    • SEO失败原因
    • 核心因素
  • 关键词排名波动原因

    排名波动原因

    理论上讲,关键词的排名决定了网站的流量,定期审查关键词的排名是每个SEO人员的工作,在以往的工作我们可能会遇到这样一种情况:关键词排名频繁波动,很不稳定。​它往往搞的SEOer一头雾水,明明没有过度优化,为什么还会出现这个问题?

    1759
    • 排名波动原因
-- 这已经是底线了,看看别的把! --