首页 >  SEO >  SEO知识 >  正文

巧用robots避免蜘蛛黑洞

 作者:潘某人SEO
1399

今天我们来了解下什么是蜘蛛黑洞,黑洞大家应该有一定的了解,属于一种高质量高引力天体,包括光任何的物体都无法逃逸。蜘蛛黑洞既是蜘蛛进入之后无法再出来,对正常的抓取工作产生负面影响。

造成蜘蛛黑洞的原因

有些站点含有大量的重复页面,常见的如站点的内容雷同,但具体参数不同的动态URL ;就会导致蜘蛛抓取大量相似或者相同的内容,导致有限的抓取频次被消耗殆尽,一定程度上影响了有价值页面的及时收录。

巧用robots避免蜘蛛黑洞

重复内容其实很难避免,比如有的站点内容页面有筛选功能,通过不同的条件去筛选显示对应的内容,常用的技术有点就是根据条件通过ajax查询反馈结果到当前页面,就会导致不同的查询结果,出现同一个链接带不同参数的url出现。最终就导致展现有大量的带参数的重复url被收录。不仅仅会影响搜索引擎的抓取,站点出现大量的相似内容也会对网站的评级产生影响。

屏蔽动态链接

对于这类情况处理还是很简单的,就是屏蔽所有动态链接的抓取,通过robots.txt文件规则来实现。在robots文件中添加Disallow: /*?* ,即禁止搜索引擎访问网站中所有的动态页面。这样就可以简单高效的屏蔽了低质量页面的抓取,有效的避免了蜘蛛黑洞的出现。

但是有的时候某些站点的动态页面是有价值的,是需要被收录的,直接屏蔽所有动态页面的抓取是不合理的;可以在Disallow: /*?* 的下一行添加允许抓取的动态链接,比如站点"/seodd"目录下的动态链接允许抓取,那么就是添加一行 allow: /seodd/*?* 。如果需要放通的比需要屏蔽的更多,就可以一个个目录屏蔽,而不是屏蔽所有目录再去放通某个目录。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seozhishi/691
相关文章
  • 百度新闻检索准入规则更新

    新闻源准入规则

    2021-04-16百度更新了“新闻资讯”的准入规则,“为满足用户对高时效性新闻资讯的需求,百度新闻检索数据分发策略在2017年由人工运营+策略识别的新闻源升级为纯机器识别的分发策略,符合准入标准的百家号内容和网站内容,无需申请都有机会通过百度时效性产品展现给用户。”

    1126
    • 新闻源准入规则
  • 长尾关键词

    关键词建设,长尾关键词

    什么是长尾关键词,不管网站权重高低,长尾词的建设在SEO优化中起着至关重要的作用,长尾关键词不仅可以提升目标关键词的排名,其次长尾关键词占据着更多的流量

    1928
    • 关键词建设
    • 长尾关键词
  • SEO行业面临的困境

    SEO行业的困境

    SEO行业面临的困境,客户对于SEO不正确的理解和期望值过高​、美好的SEO前景、Seo竞争如火如荼该放弃还是坚持 、从事seo每一个阶段都要有不同的方略 。

    1656
    • SEO行业的困境
  • nofollow标签对于网站优化的作用

    nofollow标签,内链优化,外链优化

    nofollow标签对于网站优化的作用,针对nofollow标签在外链优化以及内链优化中的作用,以及注意事项简单的分析了其作用,对于网站优化还是十分重要的!

    1496
    • nofollow标签
    • 内链优化
    • 外链优化
  • 影响网站页面加载速度的原因,如何提升加载速度

    页面加载速度,网站优化

    百度搜索对用户行为的研究表明,页面首屏的加载时间在1秒以内的页面,会带给用户流畅快捷的极速体验,而加载速度过长的页面,会加快用户的流失。谁在影响页面的加载速度?

    665
    • 页面加载速度
    • 网站优化
  • 排名优化中所说的指数和搜索量有什么关系

    搜索指数,百度指数

    百度搜索指数代表着什么,网站的权重数值是通过关键词的搜索指数得到预估流量来的,但是知道百度指数的计算方式,我们就可以知道所得到的权重并不准确只能当作是参考

    1447
    • 搜索指数
    • 百度指数
  • 百度搜索劲风算法解读

    百度劲风算法上线

    2020年2月27日,百度站长平台发布公告,将于近期上线“劲风算法”,主要打击网站及智能小程序通过恶意构造聚合页面内容来获取搜索排名,获得搜索用户关注等行为。

    1939
    • 百度劲风算法上线
  • 如何增加关键词密度

    关键词密度

    关键词密度需要控制得当,关键词密度不同行业也是不同的不可人云亦云,还得自己通过不断试验测试分析,同时关键词铺排要自然分散,增加关键词密度不是堆砌关键词。

    1614
    • 关键词密度
  • 网站收录速度和权重的关系

    收录和权重的关系

    网站收录速度和权重的关系,对于搜索引擎来说,对于网站的重视程度如何和这个权重并没有直接的关系,建议大家还是更多关机没人访客数的变化,这个才是重要,网站存在意义就是作为用户抓取的一个平台,而不是为了去做多好看的权重。

    1432
    • 收录和权重的关系
  • 修改网站标题对排名有影响吗

    修改标题,排名影响

    修改网站的关键词标题等会影响网站的排名吗,网上大多数的说法是站点的关键词标题不能够轻易修改,对于网站的排名影响很大,但是真相并非如此......

    1879
    • 修改标题
    • 排名影响
  • 深度详解SEO页面加载时间那点事

    加载速度,seo优化

    在SEO优化中页面加载时间是用户体验中重点考量的因素之一,那么大家知道页面加载的理想时间是多少呢?又如何才能提升站点的加载速度呢?先说结论,为了保证正常用户体验,页面首屏的加载完成要控制在1.5秒以内,再慢也不能超过3秒。

    706
    • 加载速度
    • seo优化
  • 内链算法快,快速提升关键词排名

    内链算法

    内链算法快,快速提升关键词排名?内链是搜索引擎200多项算法中对网站打分的一个重要算法,利用内链算法快速提升权重获得排名。但是做内链的思维和方向你们知道怎么做是有利内链算法加分的。内链不能随便乱链,

    1661
    • 内链算法
  • 学习seo网站优化难吗

    seo网站优化难吗

    对于SEO优化这个岗位可以说任何一个学科都不涉及,因此SEO优化基本都是零基础入门的,那么SEO优化学习难吗?如何才能够学好SEO优化呢?也许你是参加了培训机构,也许你是自学SEO优化。

    1130
    • seo网站优化难吗
  • 百度移动适配工具如何使用

    移动适配工具

    百度移动适配工具如何使用?百度移动搜索提供“移动适配”服务,如果您同时拥有PC站和手机站,且二者能够在内容上对应,即主体内容完全相同,您可以通过移动适配工具进行对应关系提交。

    2187
    • 移动适配工具
  • 百度spider对新链接重要程度判断

    百度spider

    影响Baiduspider正常抓取的原因,下面就要说说Baiduspider的一些判断原则了。在建库环节前,Baiduspider会对页面进行初步内容分析和链接分析,通过内容分析决定该网页是否需要建索引库,通过链接分析发现更多网页,再对更多网页进行抓取——分析——是否建库&发现新链接的流程。

    402
    • 百度spider
  • 百度抓取频率高代表什么,如何调整

    抓取频率调整

    百度蜘蛛抓取频次是根据网站的内容量来的,简单的来说,如果网站的内容多那么抓取频次就高;如果网站的内容少,那么百度抓取的频次就低。百度抓取频率高代表什么,如何调整?

    3431
    • 抓取频率调整
  • 百度搜索引擎Spider抓取系统的基本框架

    搜索引擎,百度spider

    互联网信息爆发式增长,如何有效的获取并利用这些信息是搜索引擎工作中的首要环节。数据抓取系统作为整个搜索系统中的上游,主要负责互联网信息的搜集、保存、更新环节,它像蜘蛛一样在网络间爬来爬去,因此通常会被叫做“spider”。例如我们常用的几家通用搜索引擎蜘蛛被称为:Baiduspdier、Googlebot、Sogou Web Spider等。

    617
    • 搜索引擎
    • 百度spider
  • 网站排名靠前的方法

    排名靠前的方法

    网站排名靠前的方法?如何让网站内容排到首页是所有SEOER们日思夜想的问题,其实当关键词的排名到了前50,或者说想进入前二页并不是简单的靠页面优化就可以达到的排名,无论你页面关键词布局多么合理,只要不是权重绝对高,基本上是很难进入前二页的。

    894
    • 排名靠前的方法
-- 这已经是底线了,看看别的把! --