大家有没有发现很多时候我们在robots文件中添加了禁止抓取的内容,但是还是被正常的收录了,这个就比较气人了有的人是不管怎么折腾就是不收录,有的人禁止抓取的内容尽然还在收录,没有对比就没有伤害!
那么为什么明明已经设正确设置的robots的屏蔽规则,但是就是不生效导致不该收录的内容被收录了呢?
robots更新周期
造成这一问题主要的原因,潘某人SEO认为主要还是在于robots的更新周期,搜索引擎每次抓取网站的内容的时候并不会每次都抓取下robots文件,因此很多时候站点更新了robots文件的规则了,但是搜索引擎并没有抓取最新的robots规则,还是会按照之前的规则进行抓取。
如何避免
首先网站搭建的时候就应该做好结构的规划,在网站上线的时候就应该完成robots文件的配置,避免后期去调整,是最有效的方法。但是在实际情况中很少有站点可以做到这一点,那么在robots文件规则发生变化的时候,要避免不该收录的内容被继续收录的问题,就需要及时通知搜索引擎站点更新了robots文件。
以百度搜索引擎为例子,百度搜索资源平台为站长们提供了相关的robots更新工具,在robots文件更新之后,可以前往这个工具进行更新,从而加快搜索引擎发现robots更新周期,如下图所示。
已收录内容如何处理
即使我们已经进行了robots规则更新,但是已经收录的内容,虽然在robots文件中进行了屏蔽,但是这些已收录的内容往往需要很长一段时间才会消失,甚至有可能长期不消失。
其实当我们最新版本的robots文件生效之后,新收录的内容会规则当前规则进行;但是已经收录的内容并不会马上消失,而是要等待之后的再次抓取的时候才会生效。然而不同的站点的已收录内容的抓取周期上的差距会很大,即使是同一个站点,不同内容的抓取更新周期也不一样。
如何加快已收录内容的删除
有时候一些已经被收录的内容,需要快速的让搜索引擎删除收录,仅仅靠robots文件进行屏蔽是做不到的。潘某人SEO在此分享一个简单高效的方法,那就是死链接提交。将误收录的页面状态码设为404,但如果页面仅仅只是不想被搜索引擎收录,但是还是允许被用户访问。
那么这个时候就不可以简单粗暴使用404页面,这个时候就可以通过后端根据客户端的user-agent判断当前访问如果是属于搜索引擎则返回404页面,其它的访问者则正常的访问。然后在搜索引擎提交死链,会比你单纯的等待robots文件生效的效果高很多。
相关文章
-
robots文件有什么用
robots文件作用对于SEO优化不可忽视给i,可以有效提高网站内容的质量减少重复收录,保护隐私数据不被抓取!
-
robots文件里该不该加上sitemap地址
robots文件里该不该加上sitemap地址,有种说法就是搜索引擎抓取一个网站首先会抓取robots文件,这样把sitemap地址写在robots文件里,这样搜索引擎可以地址直接的对网站地图进行抓取,可以加快链接收录的速度,真相并不是这样
-
巧用robots避免蜘蛛黑洞
今天我们来了解下什么是蜘蛛黑洞,黑洞大家应该有一定的了解,属于一种高质量高引力天体,包括光任何的物体都无法逃逸。蜘蛛黑洞既是蜘蛛进入之后无法再出来,对正常的抓取工作产生负面影响。
-
SEO优化必须掌握的robots文件协议
robots文件使用来申明网站哪些内容允许搜索引擎抓取,哪些内容禁止搜索引抓取的;正确的设置robots可以提升搜索引擎对网站的抓取效率,同时避免不必要的内容被抓取展现。但在实际运用中很多站点没有正确的使用robots导致了一些问题,今天潘某人SEO就为大家揭秘下robots的注意点。
-
巧用Robots避免蜘蛛黑洞
搜索引擎的蜘蛛黑洞指的是搜索引擎蜘蛛在抓取站点内容的时候出现了大量雷同内容的url,导致搜索引擎蜘蛛一直被困在无限的循环中,如黑洞一般。直接的结果就会导致消耗大量的抓取资源。
-
如何屏蔽某些页面的抓取,但是让页面中链接正常抓取
如何屏蔽某些页面的抓取,但是让页面中链接正常抓取,对于这种情况,使用meta标签来进行屏蔽页面的抓取,可以变得更加的有效。相比常用的robots文件屏蔽,或者nofollow标签屏蔽的实用性更加的广。
-
百度搜索无法提交链接怎么解决?
近期大家应该发现了百度搜索资源平台的大多数的站点api提交额度基本都将为的10条,并且无法提交sitemap,为什么会出现这种情况,又应该如何解决链接提交的问题呢?
-
收录和索引别搞混了!
我敢说很多人连收录和索引都会搞错,当你觉得这么简单的怎么可能错的时候,搞不好你就是其中之一,今天就你了解下收录和索引的区别,各个搜索引擎大同小异,以百度搜索引擎为例。
-
图片懒加载对于SEO优化有影响吗?
网站图片使用懒加载也就是延迟加载技术,对于SEO优化会有不良的负面影响吗?对于图片的延迟加载我们应该如何去看待处理,才能做到兼顾网站的加载速度以及SEO优化的效果呢?
-
wordpress建站怎么样,适合SEO优化吗
wordpress建站是非常不错的,非常使用于新手,可以不写一句代码,快速的搭建属于自己的一个站点,并且wordpress拥有大量的模板插件,不但可以满足美观的展示效果,大量的插件支持也可以满足基本的SEO优化需求。
-
修改网站关键词会影响网站排名吗?
对于网站关键词关键词会不会影响网站排名,相信大多数人都是人为网站关键词的修改对于网站的排名会有很大的影响的。但是在现实中很对网站因为运营需求的改变,就不得不需要对网站的关键词进行修改。那么如何才能保证网站的受到最小的影响呢?
-
适用各种编程语言网站的百度API链接推送方法
主动提交也叫API提交,是通过api接口调用来实现连接的推送,非常的便捷高效。只需简单的几行代码就可以实现秒提交数万的链接,还是非常给力,但是就是需要一定编程能力。不过当你看到这篇文章时,就需要恭喜你得到一种傻瓜式的API提交方法,无需编程开发能力,也无需对网站做任何的修改。
-
HillTop谷歌排名算法
HillTop算法可以有效的屏蔽垃圾低质量外链,防止外链作弊。其实HillTop算法的指导思想和PageRank的是一致的,都是通过网页被链接的数量和质量来确定搜索结果的排序权重。
-
百度内容发布时间的重要性
为什么搜索结果页的快照时间修改为了内容发布时间。内容发布时间对于网站的排名又有什么样的影响呢?网页内容的产生时间更精准的告知用户,降低用户选择成本,提升点击效率,同时也能够提升网站的转化率。
-
有效索引与关键词排名的关系
大多是人都知道索引这个词,但是不知道什么是有效索引,页面的排名取决于能不能进入有效索引库以及处在什么位置。
-
网站ICP备案对于SEO优化的影响
网站ICP备案对于SEO优化的影响。先说结论,如果你的优化重点是国内的搜索引擎,那么网站ICP备案至关重要。很多年前网站备案对于SEO优化影响度很低,但是近几年已经完全不一样。
-
做seo需要具备哪些条件
并不是所有网站所有行业适合做网站优化,哪些网站适合做SEO优化呢?需要哪些条件呢?
-
SEO必须了解这些h5标签,内含检测工具及方法
HTML5标签对SEO的作用主要体现在内容语义化、结构优化、用户体验提升三个维度,通过帮助搜索引擎精准理解网页内容,提升页面在搜索结果中的可见性。通过系统化应用HTML5标签,可实现技术SEO与内容SEO的双重优化,显著提升网站在搜索引擎中的竞争力。