首页 >  SEO >  SEO知识 >  正文

内容防抓取原创保护的方法

 作者:潘某人SEO
298

​站点的内容经常被恶意采集爬取,辛辛苦苦码的原创内容被人轻而易举的强取豪夺,被采集可以说是另站长们最痛疼的事情之一了,今天潘某人SEO就与大家分享若干方法,期望可以对大家有帮助。

抓取采集的特点

首先我们需要总结出采集抓取行为的特点才能更好的对症下药。恶意采集的危害极大,站点必须快去识别并封禁。采集行为的主要特别潘某人SEO认为主要的特征有:

  • 同ip短时间内大量访问网站资源
  • 同ip网段爬取爬取网站资源,各个ip爬取的量不大,容易被忽视
  • 能够访问人眼无法看到的链接入口
  • 页面停留时间短,无页面操作

鉴别异常ip

学会如何鉴别异常ip就可以组织大部分的采集抓取行为,但是这里有个重点,也是需要我们谨慎处理的,那就是区分开搜索引擎和恶意爬虫。
在技术上搜索引擎和采集爬取的恶意行为都是通过爬虫进行的,如果不做好鉴别容易对搜索引擎完成误伤导致对SEO优化产生影响。

建立ip白名单

需要建立ip白名单,在此名单的ip需要不受任何约束的可以访问站点的资源。而这类ip指的是站点需要优化的搜索引擎的爬取ip地址。
大家可以通过官方发布的爬虫ip网段进行添加,但是这种方法无法获取到搜索的ip,甚至有的搜索引擎是没有公布爬虫的ip网段。但这也是有解决方案的,可以在后端添加一个ua获取的功能,通过获取访问者客户端的request信息的user-agent,去匹配各大搜索引擎公布的搜索引擎的UA,将符合的ip添加相关记录到网站后台。
内容防抓取原创保护的方法
经过半个月的爬取,搜索引擎蜘蛛的所有的网段几乎都会访问过站点。但是需要考虑到很多恶意蜘蛛会仿冒搜索引擎蜘蛛的ua,因此这些ip需要人工去确认真实性,可以通过官方提供的ip反查方式去确认,确保加入白名单的ip网段是正确的。

截获异常请求方法

对于正常的用户通过浏览器网页访问只能发起get请求,搜索引擎蜘蛛也只会发起get请求。因此,只要是正常的网页有ip发起非get请求的,应该对其直接禁封。很多恶意蜘蛛或者是攻击者为了效率,会先发送head请求来确认页面的可访问性。
经过以上的处理,基本可以鉴别出真假蜘蛛ip,一旦建立了完整的白名单之后,就可以正式开始布局,当然搜索引擎的网段有一定程度会有变化,所以要定期维护好ip白名单。

蜜罐布置

上面讲到了爬虫和人的访问行为特点上有区别的,我们可以给页面上添加一点蜜罐也就是陷阱,去等爬虫掉入我们布置的陷阱残酷身份。
方法很简单,只要在高频关键页面比如页面的foot位置,或者选择一个可以被大多数页面都加载到的位置添加一个像素大小为0的div并且放置一个入口链接,并且位置不容易点击的。对于正常用户,不可能看到,也就不可能点击访问到,也就是说访问此页面的必然是爬虫,一旦识别并且不是白名单直接秒封ip,为了后期维护的方便最高添加上后台记录,方便筛查。

人工采集的屏蔽

这种的危害不是很大,不一定要去做屏蔽,如果要屏蔽也有很简单的做法,常见的方法有屏蔽页面的复制功能,但只能屏蔽掉小白。一但打开调试窗口,或者禁用js就无法起到效果。
不如大方点允许去复制,但是在页面添加复制触发一个统计事件,向后端发送客户端复制内容的字数,以及在当前ip下在多个个页面进行的复制了操作,适当的允许复制有利于提升用户体验。当复制行为触发预设值直接屏蔽ip。

今天分享就到这里了,后面有更好的方法在做分享。

公众号
潘某人SEO 关注我每天学习SEO优化相关知识... 470篇原创内容
潘某SEO 公众号
申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于CC0协议或已获得VRF授权的图库站点 版权申明:本文为博主原创,未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本文地址:https://www.chateach.com/seo/seozhishi/986baohu
相关文章
  • SEO内部链接优化

    SEO优化,内链优化

    在研究网站内链前,首先先要知道内链的种类有哪些,哪些位置会出现内链,各个位置的内链又有什么区别呢?内链对于SEO优化起到了什么作用。

    732
    • SEO优化
    • 内链优化
  • 网站排名优化seo学习心得

    seo学习心得

    近几年网络推广的费用成本直线上升,正是因为如何免费的SEO优化更加的得到青睐,可以有效的降低推广成本,因此对于SEO优化这块的专业人士的需求还是很大的,SEO优化作为在学校之后没有设立任何教学的领域,更多的依靠社会人士的自学来创造出相关的专业人士。

    812
    • seo学习心得
  • 如何更新或删除百度快照

    百度快照更新

    很多人在优化的过程中想要去更新或者删除百度快照,但是碍于自己还是新手,实战经验不是很丰富,不懂得如何去操作,今天我给大家简单的分享一下。有时候,我们对网站进行了改版,修改了标题、描述等等,这个时候我们想要更新百度快照,让快照尽快更新过来,或者让标题、描述快速更新过来,怎么办?

    1705
    • 百度快照更新
  • 网站如何制作才会被百度收录?

    网站内容规划

    网站如何制作才会被百度收录? 新网站建设成功后,只有在百度等大型网站被审核认可后,才能被其他人搜索,所以如何使百度收录成为一个非常重要的问题

    1892
    • 网站内容规划
  • DNS对于SEO至关重要

    DNS服务器,seo

    如果你错误的选择dns服务器,那么对于站点的SEO优化是致命的,轻则影响SEO效果,严重的甚至站点会被搜索引擎所屏蔽。因此重视dns服务器,正确的选择对于seo优化是必要的也是重要的。

    202
    • DNS服务器
    • seo
  • 网站内容更新频率对SEO的影响

    SEO的影响,内容更新

    ​想必大家都听过,每天要定时定量的更新内容,来促进蜘蛛的抓取从而获取到更高SEO效果,相信很多站点都一直坚持着内容的更新。这么做虽然没有大问题,但是很多时候却是在徒劳的浪费人力。

    440
    • SEO的影响
    • 内容更新
  • 域名泛解析对SEO优化的影响

    泛域名解析

    域名泛解析对SEO优化的影响超乎你的想象,通过泛域名解析来增加抓取及收录,在现阶段基本可以认为是提条绝路,基本上是百害无一利。

    2243
    • 泛域名解析
  • 百度抓取频率高代表什么,如何调整

    抓取频率调整

    百度蜘蛛抓取频次是根据网站的内容量来的,简单的来说,如果网站的内容多那么抓取频次就高;如果网站的内容少,那么百度抓取的频次就低。百度抓取频率高代表什么,如何调整?

    2708
    • 抓取频率调整
  • 建站用老域名效果更好吗

    老域名建站

    建站用老域名效果更好吗?首先要知道重点住在与域名的年限,而是域名的质量,历史优化记录。并且老于是可与不求,虽然说会有一定的效果,但是你想获得的成本比你优化的投入更加大。

    892
    • 老域名建站
  • SEO优化权重的错误认知

    SEO优化,权重

    如果你觉得权重就是seo优化的衡量标准,那么一定要看完这篇文章。相信对你肯定会有帮助,首先公布结论,权重作为SEO效果的衡量标准,只能作为参考,并且参考意义的大小还要根据实际情况分析。

    538
    • SEO优化
    • 权重
  • 为什么大多数站点SEO以失败告终

    SEO失败原因,核心因素

    做SEO优化的站点很多,从事SEO行业的人也不少;但是成功的站点没几个,SEO高手没几个。那么到底是什么原因导致了大多数站点的SEO优化没有效果,都以失败告终了呢?

    739
    • SEO失败原因
    • 核心因素
  • 网站权重优化方法

    网站权重优化

    网站权重优化方法有哪些,我们没该如何优化提升网站权重对于SEO优化人员来说是最关心的话题了。在讲网站权重优化之前我们首先我们需要搞明白一点什么是网站权重,其实很多人并没有真正的认识权重的含义,很多人过多看中权重。

    1944
    • 网站权重优化
  • 网站地图sitemap的注意事项

    sitemap注意事项,网站地图

    链接提交是站长们每天都会去做的事情,sitemap提交的注意事项,虽然说sitemap提交收录速度不是最快的,但是功能却是最强大的。

    633
    • sitemap注意事项
    • 网站地图
  • HTTP和HTTPS对于SEO优化有影响吗

    HTTP和HTTPS,SEO优化

    HTTP和HTTPS对于SEO优化有影响吗?这应该是很多人会有疑虑的,由于很多老站点都是http协议的,会纠结https对于seo优化会更加友好吗?在网站是否升级https的问题上犹豫不觉着。结论是有条件升级https的还是尽可能升级。

    364
    • HTTP和HTTPS
    • SEO优化
  • 怎么提高网站收录速度

    提高收录速度

    怎么提高网站收录速度?网站收录对于网站优化来说是非常重要的,我们当然喜欢是网站的收录速度越快越好,这样对于我们内容的保护起到很重要的作用,因为如果网站收录速度很慢,这样很容易自己的原创内容被人抄袭,别人还先收录了成为了原创而你的成了抄袭这个是很悲催的一件事。

    1071
    • 提高收录速度
  • nginx网站域名重定向怎么做

    nginx重定向,网站域名重定向

    网站上线最基础的一步就是确立域名如何重定向,如果最优的设置重定向。一方面要确立网站主域,另一方面跳转配置不遗漏并且尽可能减少没必要的跳转。

    715
    • nginx重定向
    • 网站域名重定向
  • 用户喜欢的内容的样子,你知道吗

    SEO优化,用户喜欢的内容

    SEO优化回归本质是内容的优化,内容的核心是基于用户的需求,那么你了解用户吗?用户真正想要的内容是怎么样呢?当你搞明白了这个问题,相信对于的SEO优化会有很大的帮助。

    610
    • SEO优化
    • 用户喜欢的内容
  • TrustRank域名信任度

    TrustRank域名信任度

    TrustRank域名信任度?由于搜索引擎在计算网页排名的时候,非常依赖连接,而且连接的质量越来越显得重要。由于搜索引擎在计算网页排名的时候,非常依赖连接,而且连接的质量越来越显得重要。在这种情况下,需要对连接的来源站点质量进行判断。更重要的是,以前依靠连接和相关性来决定排名的方式,

    1566
    • TrustRank域名信任度
-- 这已经是底线了,看看别的把! --