首页 >  SEO >  SEO知识 >  正文

如何鉴别真假蜘蛛,代码自动化

 作者:潘某人SEO
1450

相信所有站长都很痛恨假蜘蛛,我们这里说的蜘蛛是指搜索引擎爬虫蜘蛛。在我们观察网站日志的时候我们会发现有一些蜘蛛很有迷惑性,跟真蜘蛛一模一样,根本无法直接通过肉眼区分出来。

鉴别真假蜘蛛的方法

想要准确无误的判定蜘蛛的真实性,那么只有一个途径就是放过蜘蛛的IP反查其解析的域名,具体的方法参照真假蜘蛛ip识别。简单的讲就是我们可以通过电脑的cmd等工具使用“nslookup + ip”,看返回的结果是不是对于搜索引擎的域名。

因为访问的user-agent是可以修改的,但是这个ip与域名之间的解析,要么是域名所有者或者是劫持域名解析。对于搜索引擎的来说,通过这个方式的可能性为零,所以我们判定蜘蛛的真实性,只能使用这个方法。

假蜘蛛的目的

那么这些假蜘蛛的目的是什么,大多数就是为了采集你网站的内容、或者是对于网站进行攻击分析,伪装成搜索引擎蜘蛛可以获取站点的信任,降低被发现的可能性。如果你经常观察网站日志是很好发现的,搜索搜索引擎不会去抓取内容资源之外的链接。同时搜索引擎不会集中时间段去大量抓取内容,也不会去有顺序的挨个去抓取页面内容。

如何鉴别真假蜘蛛

虽然通过日志可以辨别出,但是我们不可能去时时刻刻监控网站日志;对于一些抓取内容的而已蜘蛛我们发现的时候,内容已经被爬了去了再去屏蔽意义也不是很大了,那么有什么办法自动化处理这些假蜘蛛呢?

代码自动化鉴别假蜘蛛

分享一个我觉得不错的方法,那就是在网站后端请求的时候对于访问客户端的身份做一个鉴别,对于存在问题的ip立刻进行一个屏蔽处理,就可以尽可能的保护我们的原创内容不被别人抄袭了去。

第一步就是鉴别,访问者的请求头也就是user-agent。如果请求头是蜘蛛名,那么我们就要判断其真实性,基本的原理就是反查ip。比如在php中我们无法使用nslookup命令去进行反查。但是我们可以使用gethostbyaddr()函数可以实现nslookup同样的功能。

第二步就是确认蜘蛛真实性,我们把gethostbyaddr()函数的返回值,去匹配下各个蜘蛛域名;就可以确认真的ip是不是真的搜索引擎爬虫。

第三步屏蔽处理与放通,对于存在问题的蜘蛛我们可以直接屏蔽当前IP访问网站的权限,同时你也可以直接返回一封警告信给它,估计会被你震惊到的。对于是真实蜘蛛的IP我们添加为白名单,下次直接放通不再做鉴别。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seozhishi/657
相关文章
  • 网站不收录的原因及如何处理应对

    收录

    网站不收录问题不管是新站还是老站都会面临的问题,那么当网站遇到收录问题的时候应该如何应对,如何找到问题所在呢?

    646
    • 收录
  • SEO网站站外优化怎么做

    SEO站外优化

    SEO站外优化,如果你只是认为发发外链,那么恭喜你错了!站外SEO优化可以分为两个维度:通过站外内容链接的发布,通过外链给网站引流或者带来权重上的导入;另一个维度则是品牌的曝光建设,看似和SEO没有直接的关系,反而比前者更加重要。

    666
    • SEO站外优化
  • 移动网站建设常见问题

    移动网站建设常见问题

    移动站点变得越来越重要,那么我们应该如何做好移动站呢。移动站点和PC站点相辅相成,都是一个互为补充的关系,少了任何一个都是不合理的,那么在移动站点的优化中常见的问题有哪些呢?

    1612
    • 移动网站建设常见问题
  • SEO优化之网站速度优化

    SEO优化,网站速度

    网站加载速度优化是非常有必要的,不仅仅是对于SEO优化,对于用户的访问转化起到了决定性的作用,看来看看有哪些因素会影响网站速度吧!

    660
    • SEO优化
    • 网站速度
  • 原创内容收录更快吗

    原创内容的收录

    分析下,原创内容在网站优化时对于收录的作用,从深层阐述了,原创性高不一定就可以获得好的收录和排名。对于seo优化来说正真需要的并不是简单的原创,而是需要........

    2652
    • 原创内容的收录
  • 百度信风算法

    百度信风算法,翻页诱导

    百度信风算法是打击翻页诱行为的算法, 是为了防止站点通过利用翻页进行诱导,从而保护用户的浏览体验。

    2086
    • 百度信风算法
    • 翻页诱导
  • 必应搜索引擎如何进行手动URL提交

    URL提交,必应

    必应搜索引擎找不要手动URL提交入口的速度来看解决方案。如何在必应搜索引擎上提交站点的URL链接呢?有很多小伙伴反馈,在必应站长工具后台找不到手动提交URL的入口,今天潘某人SEO就来分享下,如何在必应搜索引擎站长后台进行手动URL连接的提交。

    1926
    • URL提交
    • 必应
  • 网站SEO反链优化,如何建立高质量的反链呢?

    SEO反链优化

    网站SEO反链优化,如何建立高质量的反链呢?网站的反链数即是从够从别的网站导入到本网站的链接数量。那么,反链数越多,就说明能从别的网站进入自己网站的渠道越多,这是网站优化实现排名效果的重要思路之一。

    1714
    • SEO反链优化
  • 网站移动端网页适配那种方式好呢?

    移动适配

    网站移动端网页适配那种方式好呢?何规划移动端,是自适应的方式,还是独立移动站点的方法,会在SEO优化上面具有更大的优势呢?

    1425
    • 移动适配
  • 网站使用CDN会对SEO有什么好处

    CDN,SEO优化

    CDN 是构建在数据网络上的一种分布式的内容分发网,网站使用CDN会对SEO有什么好处,如何正确的使用cdn才能发挥对于seo优化的作用。

    1017
    • CDN
    • SEO优化
  • SEO关键词优化策略

    关键词,SEO

    站点SEO关键词的优化策略应该是怎么样的。也许那个SEO从业者都有着不同看法对于这个问题,​大家SEO优化关键词的策略是怎么样的呢?

    641
    • 关键词
    • SEO
  • 站长SEO新手必看,SEO思想分享

    SEO,站长

    SEO是文学、科技、哲学、数学等共同作用的产物。大家有没有想过按照了所谓的白皮书完全按照规范去优化,但是永远都是不叫效果。

    2679
    • SEO
    • 站长
  • 网站改版301跳转,你踩坑了吗?

    301跳转,重定向,网站改版

    当网站改版时,新旧页面的链接地址或者是网站域名发生变化时,就需要在对应的搜索引擎提交网站改版规则,然后在做301跳转,这是网站的常规操作,相信大多数都知道,但是你真的觉得这么简单吗?

    765
    • 301跳转
    • 重定向
    • 网站改版
  • ChatGPT的诞生站长们害怕不

    ChatGPT,

    在ChatGPT爆火全球之后,很多人开始担心起了自己饭碗,擅长写bug抄代码的程序员的开始担心起了自己的饭碗。比起写代码ChatGPT的文案创造能力更强,那么SEO们是否对自己的未来产生了担忧呢。

    1752
    • ChatGPT
  • 如何用domian命令查询网站反链数量

    domain命令如何使用,外链反链数如何查询

    很多人会使用domain指令去查询网站的外链数量,更有机构公司把domain值当作外链数量的考核标准,真的是十分荒谬,domian真正的作用是!

    4683
    • domain命令如何使用
    • 外链反链数如何查询
  • 网站被恶意泛解析的解决方法

    恶意泛解析解决

    什么是泛域名解析,网站被恶意泛解析的解决方法。通过site对某网站进行查询的时候,发现突然多了许多的陌生二级域名页面,经过网上大量搜索才知道,这都是因为域名被恶意泛解析后导致的后果。

    1270
    • 恶意泛解析解决
  • UGC是什么意思,对于SEO优化的作用

    UGC,SEO优化

    UGC是什么意思,对于SEO优化的作用,UGC 互联网术语,全称为User Generated Content,也就是用户生成内容,即用户原创内容。

    1291
    • UGC
    • SEO优化
  • 百度下拉框的原理及删除方法

    百度下拉框,下拉词删除

    你知道什么是百度下拉框吗?百度下拉框是百度下拉词的承载容器。就是当我们搜索一个关键词的时候,搜索框推荐的相关搜索词。所以下拉框我们也可以理解为是下拉词。

    1804
    • 百度下拉框
    • 下拉词删除
-- 这已经是底线了,看看别的把! --