首页 >  SEO >  SEO知识 >  正文

百度spider抓取过程中涉及的网络协议

399

刚才提到百度搜索引擎会设计复杂的抓取策略,其实搜索引擎与资源提供者之间存在相互依赖的关系,其中搜索引擎需要站长为其提供资源,否则搜索引擎就无法满足用户检索需求;而站长需要通过搜索引擎将自己的 内容推广出去获取更多的受众。spider抓取系统直接涉及互联网资源提供者的利益,为了使搜素引擎与站长能够达到双赢,在抓取过程中双方必须遵守一定的 规范,以便于双方的数据处理及对接。这种过程中遵守的规范也就是日常中我们所说的一些网络协议。

以下简单列举:

http协议

http协议:超文本传输协议,是互联网上应用最为广泛的一种网络协议,客户端和服务器端请求和应答的标准。客户端一般情况是指终端用户,服务器端即指网 站。终端用户通过浏览器、蜘蛛等向服务器指定端口发送http请求。发送http请求会返回对应的httpheader信息,可以看到包括是否成功、服务 器类型、网页最近更新时间等内容。

https协议

https协议:实际是加密版http,一种更加安全的数据传输协议。

UA属性:UA即user-agent,是http协议中的一个属性,代表了终端的身份,向服务器端表明我是谁来干嘛,进而服务器端可以根据不同的身份来做出不同的反馈结果。
spider网络协议

robots协议

robots协议:robots.txt是搜索引擎访问一个网站时要访问的第一个文件,用以来确定哪些是被允许抓取的哪些是被禁止抓取的。 robots.txt必须放在网站根目录下,且文件名要小写。详细的robots.txt写法可参考 http://www.robotstxt.org 。百度严格按照robots协议执行,另外,同样支持网页内容中添加的名为robots的meta标 签,index、follow、nofollow等指令。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seozhishi/1058spider
相关文章
  • 怎么增加站长工具关键词库

    站长关键词库

    了解了什么是关键词库,接下来就要了解到关键词的意义了。关键词库和网站的权重是息息相关的,大家可以看一下网站权重的计算方法就明白了。简单的讲权重是根据预估流量来划分的,而预估流量就是来源于关键词库中的关键词的排名所决定的。

    1027
    • 站长关键词库
  • 权威性在百度搜索排名中的作用

    百度搜索,排名,权威性

    对于百度搜索引擎排名有一个非常重要的因素就是站点权威性,相信很多人对于权威性并不是非常的了解,今天我们就从百度搜索中的作用、什么是权威性、如何评估权威性和权威性之官方结果四个方面进行解读。

    1351
    • 百度搜索
    • 排名
    • 权威性
  • 网站排名一直掉,从这几个方面排查

    网站排名一直掉

    无论你的公司规模多大,你在搜索引擎上的一些不恰当的SEO手法,都可能会受到处罚,从而影响你的搜索排名。例如,百度、360搜索甚至会在搜索结果中完全删除你网站的页面。因此,你要避免受到惩罚,避免失去搜索流量。以下是一些简单的SEO方法,可以避免你犯错误,这些错误有可能会让你的排名全无。

    2387
    • 网站排名一直掉
  • 索引量并不能决定流量大小

    索引量

    很多人认为对于网站优化提升索引数量就可以快速的提升网站的流量,因此对于索引的增加情况十分的关注,整体的精力也是放在如何快速大量增加索引数据。

    1182
    • 索引量
  • 网站栏目数量对于权重的影响

    网站栏目,权重,seo

    ​如果您近期正在打算搭建网站,那么看到这篇文章就赶上了。很多站点在网站搭建的时候就为后期的SEO优化埋下了诸多的坑。如网站的栏目结构可以说是重灾区。网站的栏目数量要适当不宜多,对于大多数网站栏目数量控制在3-5左右差不多。

    555
    • 网站栏目
    • 权重
    • seo
  • 巧用robots避免蜘蛛黑洞

    robots,蜘蛛黑洞

    今天我们来了解下什么是蜘蛛黑洞,黑洞大家应该有一定的了解,属于一种高质量高引力天体,包括光任何的物体都无法逃逸。蜘蛛黑洞既是蜘蛛进入之后无法再出来,对正常的抓取工作产生负面影响。

    1371
    • robots
    • 蜘蛛黑洞
  • 百度自然排名的规律

    自然排名的规律

    排在百度首页的,很多人认为是经常更新内容,外链发的多,时间做得久的页面,但实则不然。那么我们如何做才能在百度SEO中脱颖而出呢?从百度排名的规则分析了如何快速获得排名呢?

    1918
    • 自然排名的规律
  • 不同域名后缀对于SEO优化的影响

    域名后缀,SEO优化

    域名在注册的时候后缀的选择性还是很大的,对于站长们会有疑虑不同的域名后缀对于seo优化效果是否会产生不同的影响,搜索引擎是否会对不同后缀域名区别对待。

    973
    • 域名后缀
    • SEO优化
  • flash、ifream、js、ajax不利于抓取收录吗

    ajax,flash,ifream,js,不利于抓取,抓取不到

    flash、ifream、js、ajax搜索引擎抓取不到,所以网站优化的时候就要去避免使用这些代码,这种想法是错误的,片面的,只要合理使用也可以帮助优化!

    1552
    • ajax
    • flash
    • ifream
    • js
    • 不利于抓取
    • 抓取不到
  • 智能小程序对seo效果那么好,为什么做的人还是很少

    智能小程序,seo优化

    站点开通智能小程序可以有机会获得站点logo权限、快速收录等权限,对于seo优化有着非常好的帮助。即使如此智能小程序的普及并不高,大家知道这是为什么吗?

    653
    • 智能小程序
    • seo优化
  • 网站SEO优化监控哪些指标

    SEO优化效果,SEO指标

    数据是进行网站建设的重要参考依据,任何网站的建立都不是凭空幻想出来的。标题的撰写、导航的确立以及内容的编辑都是依靠数据而进行,数据对于我们seo后期的工作更具指导作用。那么网站的哪些数据是优化人员需要关注的呢?

    830
    • SEO优化效果
    • SEO指标
  • 什么是面包屑导航

    面包屑导航

    什么是面包屑导航,使用面包屑导航的优点,面包屑导航的作用是告诉访问者他们目前在网站中的位置以及如何返回。

    827
    • 面包屑导航
  • 关于惊雷算法的要点解读

    惊雷算法解读

    惊雷算与1.0不同的是针对恶意链接的问题提出了整顿,下面让我们带你一起解读。对这个情况进行说明:针对恶意了知道作弊超链、恶意刷点击的作弊行为进行了算法的再次升级。

    1803
    • 惊雷算法解读
  • seo优化自学难吗?

    seo自学

    seo优化自学难吗?不少人想进入SEO这个行业,由于个人原因无法去参加培训,想自学SEO,​对于自学SEO优化,这个问题,如果实在没有办法,在网上有很多实战教程,但是还是建议多看相关的书籍比网上学习更好。

    1147
    • seo自学
  • 做seo常用的4个标签

    SEO常用标签

    在做seo的时候,经常会碰到网站页面的标签的使用问题,这些标签你不得不好好对待。因为这些标签可以帮助日后的网站优化,并且很有利于提高网站权重。那么下面就和你说下做seo常用的4个标签:

    1613
    • SEO常用标签
  • 进入前100名的关键词如何提升排名

    关键词排名提升

    进入前100名的关键词如何提升排名如何提升?持续更新,切勿大动干戈,50-100名就是就是搜索引擎对页面最后的考察期,一旦进了50名那就不一样了。按照以往的经验来说,网站排名在这个区间会持续短则一个星

    1422
    • 关键词排名提升
  • 网站改版301跳转,你踩坑了吗?

    301跳转,重定向,网站改版

    当网站改版时,新旧页面的链接地址或者是网站域名发生变化时,就需要在对应的搜索引擎提交网站改版规则,然后在做301跳转,这是网站的常规操作,相信大多数都知道,但是你真的觉得这么简单吗?

    706
    • 301跳转
    • 重定向
    • 网站改版
  • 如何提升seo网站收录的关键点

    seo收录

    seo近1年来大家应该发现了网站越来难收录了,很多站点以前都是正常收录的也出现了收录难,那么要如何解决收录问题呢?

    586
    • seo收录
-- 这已经是底线了,看看别的把! --