首页 >  SEO >  SEO算法 >  正文

链接权重分析HITS算法的不足之处

2173

理解HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。HITS(Hypertext-InducedTopic Search)算法是利用Web的链接结构进行挖掘典型算法,其核心思想是建立在页面链接关系的基础上,对链接结构的改进算法。HITS算法通过两个评价权值——内容权威度(Authority)和链接权威度(Hub)来对网页质量进行评估。其基本思想是利用页面之间的引用链来挖掘隐含在其中的有用信息(如权威性),具有计算简单且效率高的特点。HITS算法认为对每一个网页应该将其内容权威度和链接权威度分开来考虑,在对网页内容权威度做出评价的基础上再对页面的链接权威度进行评价,然后给出该页面的综合评价。内容权威度与网页自身直接提供内容信息的质量相关,被越多网页所引用的网页,其内容权威度越高;链接权威度与网页提供的超链接页面的质量相关,引用越多高质量页面的网页,其链接权威度越高。

首先,它完全将网页的内容或文本排除在外,仅考虑网页之间的链接结构来分析页面的权威性,这与现实网络中的权威页面相比,其不科学性显而易见。 然而HITS算法也有其明显的不足。因为权威页面必须针对某一主题或关键词而言。例如某一页面对一确定主题具有较大权威性,但这并不意味在其他与其无关的主题方面同样具有权威性。其次一个页面对另一页面的引用有多种情况,其中包含了一页面对另一页面的认可,但除此之外也有其他目的链接,如为了导航或为了付费广告。就HITS算法的思想与实现过程做了细致的研究与概括。而HITS算法在实现过程中均没有考虑以上情况.导致了结果与目标的差距。


HITS算法的不足之处


对HITS算法的第二个不足,即非正常目的的引用.在HITS算法看来,也误认为是正常引用,导致实际结果与目标的出入。针对前面第一种不足,就有相关的学者提出了一种利用超链文字及其周围文字与关键字相匹配而计算超链权值的方法,并引入系数对周围文字和超链文字进行权值的相对控制,很好地将页面文本信息引入到HITS算法,提高了算法的可靠性,并在现实中取得了很好的效果。

后来,经过不断的改进。HITS算法又引入了时间参数,即利用对一链接引用的时间长短来评价是否为正常引用。因为非正常链接其引用时间肯定不会很长(如交换链接、广告链接),相反,如果一页面对另一页面的链接时间较长,则必然反映此页面就是用户的寻找页面。即目标页面或至少是正常引用。

如设定访问时间少于1分钟者为非正常引用。如果设定时间阀值,则可以将非正常引用的链接在HITS算法的实现过程中筛选出来。另外可构造时间访问函数,控制权威页面的相对大小。如随访问时间的增大而其权威性也逐渐非线性增大.这样可为HITS算法的权威页面提供更合理、更科学的解释。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seosuanfa/386
相关文章
  • site首页位置不在第一怎么办

    site命令,site首页

    很多站长在网站优化的时候会特别的关注网站site首页的排名位置,当首页不在第一位的时候就会非常的不安,觉得网站出现了问题,认为站点被降权了。但是网站site首页不在首位很多原因都会造成这种结果。

    1331
    • site命令
    • site首页
  • 什么是闭站保护,无法申请闭站保护怎么办?

    闭站保护,seo

    闭站保护是什么,闭站保护对于站点有什么作用;但是如果站点无法申请闭站保护又要如何应对呢?今天潘某人SEO就以一次闭站的经历分享来告诉大家如何正常的处理闭站保护。

    700
    • 闭站保护
    • seo
  • 如何充分利用抓取频次

    如何充分利用抓取频次

    现在,我们已经想知道了,爬行很重要,是不是花费更多的时间来管理抓取频次?您应该(或不应该)做很多事情来让搜索蜘蛛更多地消耗更多的网站页面,以下是最大化抓取频次功能的操作列方法:如何充分利用抓取频次?

    2441
    • 如何充分利用抓取频次
  • 对seo优化人员来说,DeepSeek的爆火加速了什么?

    seo优化,DeepSeek

    对于SEO行业而言,DeepSeek 这类高效AI工具的爆火,对于seo优化不可避免的带来的巨大的变化,其影响远不止“效率提升”,而是推动行业进入人机博弈的新阶段。内容生成效率的提升,成本的降低,直接卡住了seo从业者的脖子。SEO优化人员需要积极拥抱变化、不断学习新知识新技能以适应行业的发展和变化。

    510
    • seo优化
    • DeepSeek
  • SEO内部链接的重要性

    seo内链

    很多站点会关注外链的优化而忽略了内链的优化,但是对于目前的环境来说外链的效果有效,优质外链获得的成本是比较高的,过多的垃圾外链是弊大于利。相比之下内链的的优化空间是非常大的,而且基本不受限制,做好站点的内链优化对于seo优化的意义是非常大的。

    895
    • seo内链
  • 如何禁止百度建立页面快照

    屏蔽快照

    很多站点出于隐私的考虑不希望百度保留快照,网上也在讨论如何禁止百度保留快照的方法。其实百度早已对此有过说明,但藏在一篇不起眼的文章中不引人注目,导致依然非常多的人不清楚该如何操作。

    1454
    • 屏蔽快照
  • 网站SEO优化监控哪些指标

    SEO优化效果,SEO指标

    数据是进行网站建设的重要参考依据,任何网站的建立都不是凭空幻想出来的。标题的撰写、导航的确立以及内容的编辑都是依靠数据而进行,数据对于我们seo后期的工作更具指导作用。那么网站的哪些数据是优化人员需要关注的呢?

    830
    • SEO优化效果
    • SEO指标
  • 域名后缀对seo的影响

    域名后缀SEO影响

    域名后缀以及域名的长短会对网站seo产生影响吗?早期来说域名的后缀对于SEO优化不会有任何的影响,但是随着这个行业的发展慢慢的出现了群站,如今是否存在影响也是成为了一个不确定的因素。

    2254
    • 域名后缀SEO影响
  • 360不收录的原因

    360不收录如何解决

    相信很多的seo们遇到过这个问题,就是百度的收录很正常,排名也还可以,但是360可能连首页都不收录,或者是只收录一个首页,新站和老站都会出现这个问题,那么到底是什么原因造成的呢?如何解决360不收录的问题呢?

    1537
    • 360不收录如何解决
  • 视频网页排名怎么优化

    视频排名优化

    网站视频页面排名优化,对于普通网站来说无法承受高额的硬件成本,以及相比于视频网站先天的流量不足,导致了普通网站想做视频排名优化是行不通的。

    1356
    • 视频排名优化
  • 实测——百度api和手动提交需要重复提交吗

    百度api提交,手动提交,网站收录

    很多站点为了收录速度就会使用api提交之后还会在手动提交一下链接,期望加快收录速度,那么这种重复提交的行为对于收录有作用吗,今天就来现场实测一下。

    1120
    • 百度api提交
    • 手动提交
    • 网站收录
  • 作为一名SEOER,你是否懂得一门编程语言

    seo优化与编程

    作为一名SEOER,你是否懂得一门编程语言,那么哪门编程语言更加合适呢?

    748
    • seo优化与编程
  • SEO如何选择域名,你选对了吗?

    域名,网站优化

    域名的选择主要是从站点的运营和SEO优化两个层面考虑,那你觉得哪个因素更加重要呢,可以心里默选一下,答案稍后揭晓。域名选择最基础的点:历史干净、便于记忆。

    619
    • 域名
    • 网站优化
  • 用户喜欢的内容的样子,你知道吗

    SEO优化,用户喜欢的内容

    SEO优化回归本质是内容的优化,内容的核心是基于用户的需求,那么你了解用户吗?用户真正想要的内容是怎么样呢?当你搞明白了这个问题,相信对于的SEO优化会有很大的帮助。

    868
    • SEO优化
    • 用户喜欢的内容
  • 如何让关键词排名进入前20名

    主动访问用户,排名如何进入前20

    进入50名是一道坎,靠外链用户积累可以做到,但是关键词排名进入前20名,还是得靠主动访问用户占比的提高,也就用内容抓住用户,提高用户的忠诚度,二次访问。

    1790
    • 主动访问用户
    • 排名如何进入前20
  • 关键词密度,在SEO中的作用!

    关键词密度

    关键词密度对于关键词的排名有着重要影响,那么关键词密度多少合适呢?相信大家经常听到网上的说法,控制关键词密度2-8%之间。这种说法其实是不对的,对于不同行业适合的关键密度肯定是不一样的。

    1115
    • 关键词密度
  • 地方行业网站该如何做好SEO

    地域行业seo

    地方行业网站该如何做好SEO?善于应用带地方名称关键词的密度分布,打造强悍的地方性长尾词群。

    1662
    • 地域行业seo
  • 网站收录速度和权重的关系

    收录和权重的关系

    网站收录速度和权重的关系,对于搜索引擎来说,对于网站的重视程度如何和这个权重并没有直接的关系,建议大家还是更多关机没人访客数的变化,这个才是重要,网站存在意义就是作为用户抓取的一个平台,而不是为了去做多好看的权重。

    1399
    • 收录和权重的关系
-- 这已经是底线了,看看别的把! --