SEO优化必须掌握的robots文件协议

robots文件使用来申明网站哪些内容允许搜索引擎抓取,哪些内容禁止搜索引抓取的;正确的设置robots可以提升搜索引擎对网站的抓取效率,同时避免不必要的内容被抓取展现。但在实际运用中很多站点没有正确的使用robots导致了一些问题,今天潘某人SEO就为大家揭秘下robots的注意点。

robots如何写

首先我们需要在网站的根目录下创建文件“robots.txt”,文件的编码格式必须为UTF-8;robots文件的访问路径为“域名/robots.txt”,站点需要保证此路径下访问可达性。路径和文件名必须按照上述方式来,不支持自定义。

参数1—User-agent

该项的值用于描述搜索引擎robots的名字,用于指定规则作用的搜索引擎,也是说我们可以通过User-agent指定不同的搜索引擎去执行不同的规则。

# 代表所有的搜索引擎
User-agent:*
# 此处添加所有搜索引擎遵循的规则

# 代表百度搜索引擎遵循的规则
User-agent:Baiduspider
# 百度搜索引擎遵循的规则
1
2
3
4
5
6
7

如果修改对应搜索引擎的蜘蛛名即可,蜘蛛名可以去各个搜索引擎的官方文档中获取;如果robots规则前后产生冲突的时候,那么就会按照最后的一条规则时执行。如果站点不存在robots文件,那么就是整个网站所有的内容都可以被抓取。

参数2—Disallow

Disallow 是用来定义禁止抓取内容的路径的参数,可以精确到某一条链接,也可以是一个目录。

参数3—Allow

Allow 是用来定义允许抓取内容的路径的参数,可以精确到某一条链接,也可以是一个目录,如果链接或者是目录没有被禁止无需添加也可实现抓取。Allow 的意义更多的在于是,当需要抓取的内容是在被屏蔽的目录之中的,就可以通过Allow 参数来定义被屏蔽的目录下,哪些内容又是可以被抓取的。
robots的常用命令1
robots的常用命令2

robots提交

如果搜索引擎支持robots更新提交一定记得去站长后台提交,因为搜索引擎不会频繁的抓取站点的robots文件,这就会导致规则更新了,搜索引还是会抓取一些不期望被抓取的内容,对站点的seo优化造成影响。
搜索引擎更新robots的周期一般需要1-2周的时间,这也是大家疑惑为什么规则明明正确的屏蔽了,还是被抓取了。此处还是一个非常关键的一点,robots主要是争对未被抓取的内容,如果内容已经被抓取收录,那么再去屏蔽相关路径也是无法删除这些内容的索引。
这种情况就需要大家先robots中做好屏蔽,然后对内容做404状态码返回,然后提交死链来实现索引内容的删除。如果这些内容还是允许被用户访问,但是就不希望被收录就会处理比较复杂。所以说robots一定要创建的早,并且前期做好规划避免后期修改,并在第一时间提交到搜索引擎站长后台,校验并更新robots,然后才是后续站点内容的更新,避免因为robots文件的生效周期问题,导致抓取非允许的内容。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用!

本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理

本文地址:https://www.chateach.com/seo/seozhishi/928robots

相关文章

  • 如何让搜索引擎识别页面是PC还是移动端

    SEO页面类型识别

    如何让搜索引擎识别页面是PC还是移动端,让蜘蛛有效的识别页面类型,可以使得抓取更有效率,同时给用户在不同设备访问时,给到正确的对应页面,提升用户体验。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 3081
    • SEO页面类型识别
  • 如何让网站页面更快的收录

    页面更快收录

    如何让网站页面更快的收录,网站及页面权重、网站服务器、网站的更新频率、内容的质量等方面都影响这网站内容的收录,只要做到上面这几点网站的收录不会差

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1316
    • 页面更快收录
  • 新站SEO关注哪些数据

    新站优化数据指标

    一个新站的优化我们应该关注哪些数据来判定站点目前处于一个什么样的情况。对于新站来说我们迫切希望的是可以快速的获取排名权重,但是我们又可以通过哪些数据来分析优化流程是否有问题,是否是一个正常的发展呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2659
    • 新站优化数据指标
  • 关键词库如何增加?

    如何增加关键词库

    关键词库如何增加?关键词库,是指网站所有关键词详细情况的记录,包括但不限于是否收录、排名、对应页面的URL、百度指数、月获得流量。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2503
    • 如何增加关键词库
  • 网站被镜像,如何向百度反馈?

    网站被镜像

    最近收到不少站长反馈被镜像的问题,网站被镜像后,站点流量、关键词都会受到影响,是很多网站深恶痛绝的现象,站长通过禁止正文被粘贴、禁止镜像站IP都无法彻底杜绝被镜像现象。被镜像该如何维权,学堂君整理以下投诉攻略:

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 909
    • 网站被镜像
  • 如何快速提高网站收录

    快速收录,网站权重

    如何快速的提升网站的权重,哪些因素影响了网站的收录。但是网站权重不是一朝一夕就可以提升上来的,今天从几个重要点并且是力所能及的的点讲下如何提升网站的收录。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1056
    • 快速收录
    • 网站权重
  • 低成本让网站资源加载速度提升的方法

    加载速度,网站速度

    分享一个低成本的方法,让网站速度提升的方法,通过提升网站速度提升用户体验,从而获得更好的seo优化效果。通过资源的预获取,可以实现在服务器配置不变的情况下提升网站资源加载速度的提升。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 798
    • 加载速度
    • 网站速度
  • 大多数站长搞错了SEO的核心

    SEO的核心,seo优化

    大家觉得SEO优化的核心重点是什么呢?关键词排名展现,如果您是这么认为的那请看完这篇文章,你会有不同的感悟。SEO的核心并不是在于关键词的排名,关键的排名只是途径。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 677
    • SEO的核心
    • seo优化
  • 网站seo首页标题怎么写

    seo首页标题

    标题是一篇文章的核心,是对于全片内容的一个简明扼要的概括,同样一个网站的首页的标题是整个网站的一个门面,代表着整个网站的内容及属性。那么网站的标题应该如何写,又该考虑哪些因素呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1200
    • seo首页标题
  • 二级域名和二级目录的区别

    二级域名,二级目录,内容权重的区别

    二级域名和二级目录的区别十分大,在建站的时候一定要谨慎选择,简单的描述了二级域名和二级目录的定义,以及在网站权重、内容上优化的区别!

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1779
    • 二级域名
    • 二级目录
    • 内容权重的区别
  • 索引量和收录量的区别

    关系区别,收录量,索引量

    索引量和收录量的很容易混淆认清两者的关系对于网站优化十分的有帮助,分析索引量和收录量的数据可以及时的发现网站的问题。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2576
    • 关系区别
    • 收录量
    • 索引量
  • SEO优化失败的原因

    SEO优化失败的原因

    SEO优化失败的原因解析,对于SEO优化来说到底是内容重要还是代码优化重要,最终又是什么导致了网站优化失败的结局,如何避免失败?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1666
    • SEO优化失败的原因
  • 老域名对SEO优化效果有影响吗

    域名,seo优化

    相信大家经常听到建站要用老域名,对于收录排名会有很不错的优势,那么真的是这样吗?但这个结论是有一定的道理,但是还是比较片面,并不不能说老域名比新域名更利于SEO优化。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 958
    • 域名
    • seo优化
  • ​什么是链接农场和链接工厂

    链接农场,链接工厂

    ​什么是链接农场和链接工厂,对于SEO优化会有什么影响呢?链接农场是将网站做成一个链接的养殖场,这类站点的特点就是内容质量非常低,甚至内容都很少,页面中存在海量的链接,专门用于搜集网站和交换链接提升PageRank(pr值),而没有或很少有实质性的对用户有用的内容。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1488
    • 链接农场
    • 链接工厂
  • SEO从业者必须掌握的TDK优化技巧

    SEO关键词,TDK编写,网站描述优化

    SEO从业者需要知道网站TDK是什么,需要知道SEO改如何编写关键词标题描述,现在对于搜索引擎来说关键词和描述并不是很重要了,这么调整原因就是太多了的人乱写关键词,文章与关键词相关性低;不过如果你的关

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2192
    • SEO关键词
    • TDK编写
    • 网站描述优化
  • 如何定制百度索引量查看规则

    百度索引规则

    可以通过“*”号自定义规则来查看某些特征集合的页面索引量数据。“*”号放在规则结尾可匹配到包含“/”在内的任意字符串,放在规则其他位置匹配不包含“/”的任意字符串,具体可参考下列示例:

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2005
    • 百度索引规则
  • robots文件里该不该加上sitemap地址

    robots里放sitemap

    robots文件里该不该加上sitemap地址,有种说法就是搜索引擎抓取一个网站首先会抓取robots文件,这样把sitemap地址写在robots文件里,这样搜索引擎可以地址直接的对网站地图进行抓取,可以加快链接收录的速度,真相并不是这样

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2504
    • robots里放sitemap
  • 原创内容,收录的关键?

    原创

    大家是否经常听到,很多站点每天都坚持更新原创文章,但是收录和排名并不理想。在众多因素中,原创性被普遍认为是影响内容收录速度的关键因素之一。那么,原创内容是否真的能够更快地被搜索引擎收录呢?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 355
    • 原创