谷歌的算法与百度的算法到底有什么不同?

简单讲,其不同是方方面面的。先明确一个概念。网页排序算法其实只是一个统称,并不对应一个唯一的具体算法,而是一个混杂了多种算法的排序逻辑,本质上是一个排序系统。就好像一道菜的做法,从洗菜、腌制、烹煮、调味是有很多道工序的,不是一句“大火烹算法”或“小火煮算法”能概括的。所以不能简单地说谷歌在用A算法,而百度在用B算法。两套系统是由不同研发人员,在不同的时间和地域,基于不同的资源、用户需求、用户反馈、设计思想、评价方式构造的两个不同的排序系统。可以类比MSN和QQ,亚马逊和天猫,它们的展现形式和使用体验或许类似,但内部构造的区别却是方方面面的。如果要准确回答这个问题,必须首先了解百度和Google各自的排序算法。

据坊间传闻,了解Google核心排序算法的全球总人数加起来不超过20人(包括Larry Page在内),而且这些人都在Google总部,甚至连前谷歌中国高##层都不在其中。当然这只是传闻,我相信实际人数会比这个高,其机#密程度也没到这种地步,但无论如何,我想LZ在知乎是不可能得到确切答案的(这种商业机#密即使真的有人知道,他也不可能明说的,否则就等着被起诉吧)。我只就信息检索常识的角度来说一下可能会不同的方面,以及它们对排序结果的影响,让大家有个大概的认识。这里不涉及任何公司的技术和机#密,所有涉及技术均可以从信息检索文献中查到。信息检索系统,仅就排序而言,主要流程可以归纳为两部分:特征选取,特征使用。前者选择/抽取特征,后者利用特征进行排位计算。所谓特征就是反应当前查询下,各个网页好坏的一个指标,比如PageRank,BM25,用户的个性化倾向,用户反馈等。匹配度越高的网页应该排序越靠前。

1)  特征选取的不同除了在信息检索学术界有很多公认比较好的特征两家都会使用外--比如关键词的命中比例、命中紧邻程度、命中位置、PageRank(百度用李彦宏申请专利的一个类似特征)。两个公司会根据自己不同的需要和想法使用不同的特征。比如Google的用户分布在全球各地,肯定要非常重视语言/地域特征,搜中文给中文网页更好,搜英文给英文网页就好,即使同样搜英文,大陆用户、美国用户期望看到的结果也往往不同。而百度由于在初期很长的时间内只做中文搜索,这些特征初期估计没有或者用的很轻。再比如google有gmail的账号体系,而百度有知道、贴吧的账号体系,两者能够获得用户的个性化特征也是不同的(关于个人信息的收集,互联网无隐私不是什么秘密,大家心里有数就好)。总之两家由于自身定位和信息来源的不同,拿到和使用的特征是不一样的。


百度与谷歌的区别


2)使用特征方法的不同(本身写了很多,想了想,这段还是删了,总之是传闻,若是假的大家得不到有效知识,若是真的我可能就说了不该说的,真是倍感压力。。。)仅科普一下这个概念吧,目前利用特征主要方法主要有两种:人工规则、机器学习。两者最大的区别在于,前者的规则是开发人员拍脑袋想出来的,后者的规则是使用统计学方法由机器学出来的(具体怎么学请参见《机器学习》相关知识,简单讲就是你先人工标注大量搜索结果,注意是大量的,并告诉机器哪些是好结果,哪些是差结果,然后让机器通过这些例子自己总结规律。之后就可以让机器利用这些规律自动判断新的搜索结果好坏了)。这两种方法其实各有利弊,人工规则精准,但过于武断,后期会变得过于复杂庞大,不灵活;机器学习更贴合实际数据,但需要大量准确的标注数据,且不善于针对性地处理比较罕见的查询。

总之,即使两家公司用相同的特征,使用的方法也不可能完全相同;如果都用机器学习,标注数据和优化标准会有不同;如果都用规则,具体规则也会不同。这一切取舍选择,会以大部分实际用户的需求作为准绳。从这个角度讲,百度不是更懂中文,而是更懂中国网民,尤其是占绝大部分的草根网民。综上所述,两者算法不同处有很多。但无论如何不同,占绝大多数的用户需求会决定最终的排序效果。所以从结果而言google多国语言搜索更好、学术搜索更高;而百度娱乐搜索更好、草根需求满足更好。除了某些在知乎写了不能发表的内容,无论方法有多不同,搜索结果都是由绝大部分用户需求所决定的。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用!

本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理

本文地址:https://www.chateach.com/seo/seosuanfa/394

相关文章

  • SEO标题写法规范

    SEO标题写法规范

    SEO标题也就是我们常说的title标签的写法规范,标题对于直觉决定了网页获取点击的能力,影响度也是远远高于文章描述的,在搜索引中展现时,用户最注意的就是标题,因此学会书写一个合格标签至关重要。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1819
    • SEO标题写法规范
  • 快排软件提升排名的原理

    快排排名的原理

    只有有流量的页面才能证明是一个被用户所认可的页面。因此排名的相关算法都是根据这一点进项展开的,有流量第一就必须有点击,但并不是有了点击就会有排名的提升。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2887
    • 快排排名的原理
  • SEO优化核心之关键词筛选

    ·关键词筛选,SEO优化核心

    ·对于SEO优化关键词的筛选作为核心,应该是大家都认同的。如果能够真的掌握关键词筛选的真谛,那么成为一个高手也不是不可能。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 951
    • ·关键词筛选
    • SEO优化核心
  • 【重要】搜索资源平台清退风险资源

    搜索资源平台,seo

    如果站点从事百度SEO优化,那么这条消息必看,避免对日常的优化工作产生影响,未及时处理将直接影响百度搜索资源平台的账户。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 813
    • 搜索资源平台
    • seo
  • SEO优化内容的发展趋势

    SEO优化

    2022-07-14百度搜索资源平台发布了打击盗版网文站点公告,从中其实可以对seo未来的发展趋势有了大概的预测。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 575
    • SEO优化
  • 如何一本正经的胡说八道,而你深信不疑

    确认偏误,认知闭合

    人们面对未知内容时选择相信的现象,是一个涉及心理学、社会学和认知科学的复杂议题。认知闭合需求、情感补偿机制、确认偏误、群体极化效应等诸多因素,有趣的可以进一步的去了解。那么我们又如如何抵御,避免自身陷入其中。做一个聪明人,有判断力的能人,自己可以不是那个胡说八道的人,但是决不能成为一本正经胡说八道的受众群体。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 2894
    • 确认偏误
    • 认知闭合
  • 手机网站的优化注意事项

    手机网站,移动端优化

    随着智能手机的崛起,移动互联网的占比越来越高,对于部门行业领域移动端已经吊打PC端,比如电商类的站点,大部门的成交都是在移动端完成的。因此,现在开始必须注重移动手机站点的优化。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1132
    • 手机网站
    • 移动端优化
  • 百度天网算法,用户隐私保护

    百度天网算法,用户隐私保护

    百度天网算法打击恶意盗取网民的QQ号、手机号进行营销推广的行为。打击这种严重侵犯用户隐私的行为的站点。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1473
    • 百度天网算法
    • 用户隐私保护
  • SEO优化还值得做吗,为什么没有效果

    SEO优化,自媒体,优化效果

    SEO优化还值得做吗?为什么要继续坚持做SEO优化和为了SEO没效果这两个关键点分析一下。关键点从来不是SEO没有流量,而是你获取不到一个好的效果。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 809
    • SEO优化
    • 自媒体
    • 优化效果
  • 内容模块之间为何要设置合理间隔

    页面为何要设置合理间隔

    内容模块之间为何要设置合理间隔,主体内容应与广告、相关推荐等次要内容板块之间有明显间隔距离或分割线,使用户获取信息时不受任何干扰。”本文将为你详细讲解如何设置合理间隔更符合用户浏览页面信息的需要。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1514
    • 页面为何要设置合理间隔
  • 网站SEO优化到底监控什么?别只会看“权重”!

    SEO优化,权重

    在如今这个流量为王的时代,搜索引擎优化(SEO)已经成为企业推广不可或缺的一环。但很多SEO从业者和站长仍然陷入误区——过度关注“网站权重”,却忽略了真正影响转化的核心数据。其实,SEO优化不是靠感觉、也不是靠玄学,而是要靠精准的数据分析与持续的策略调整。今天,潘某人SEO就来探讨下网站SEO优化到底应该监控哪些关键指标?又该如何正确解读这些数据?

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 258
    • SEO优化
    • 权重
  • 如何快速提升关键词排名?

    提升关键词排名

    如何快速提升关键词排名?可以从流量冲击、时效性热点内容 、高质量外链、网站整体权重、交换一些友情链接,多角度同时进行有效快速提升关键词排名。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1307
    • 提升关键词排名
  • SEO必看,搜索引擎是如何提取关键词?

    关键词,搜索引擎

    了解搜索引擎是如何提取关键词,是每个SEO必须必须知道的,否则很容易一不小心优化了个寂寞。如果你认为关键词就是自己在页面keywords中设置的关键词,或者只要重复某个词就可以成为关键词,那你一定要听劝看完这篇文章。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1170
    • 关键词
    • 搜索引擎
  • H标签如何优化,对于SEO的作用

    H标签如何优化

    Heading标签也叫做H标签,HTML语言里一共有六种大小的heading 标签,是网页html 中对文本标题所进行的着重强调的一种标签,以标签<h1>、<h2>、<h3>到<h6>,共有六对,文字从大到小,依此显示重要性的递减,也就是权重依次降低。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1480
    • H标签如何优化
  • 跳出率对于网站排名的影响

    跳出率影响排名

    跳出率对于网站排名的影响,很多人认为网站跳出率高会影关键词排名,但是其实这是一种很荒谬的理论。要说跳出率影响排名,那么首先你得知道关键词排名的与跳出率之间存在哪些交集。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1482
    • 跳出率影响排名
  • SEO内部链接的重要性

    seo内链

    很多站点会关注外链的优化而忽略了内链的优化,但是对于目前的环境来说外链的效果有效,优质外链获得的成本是比较高的,过多的垃圾外链是弊大于利。相比之下内链的的优化空间是非常大的,而且基本不受限制,做好站点的内链优化对于seo优化的意义是非常大的。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 947
    • seo内链
  • 新站收录与老站收录的区别

    新站收录,老站收录,seo优化

    导致网站不收录的原因有很多,想要解决收录问题,那么首先需要找到站点不收录的原因。但是很多站点在寻找原因的时候第一个方向就错了,对于老站和新站不收录的原因是有很大区别的。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1046
    • 新站收录
    • 老站收录
    • seo优化
  • MIP Cache 服务下线通知

    MIP Cache关闭

    MIP Cache 服务下线通知,MIP Cache 服务至目前为止已上线了三年多,为 Web 生态输出了优质资源和更为快速的网页浏览体验。2020年6月1日 - 2020年6月30日:关闭站长平台 MIP 入口,逐步清退下线 MIP Cache 服务。

    用于表示时间的图标 一个时钟的图标,用于向用户表达后面跟着的是一个时间
    用于表示阅读次数的图标 一个类似睁开眼睛的图标,用于向用户表达后面跟着的数字是一个阅读的次数 1956
    • MIP Cache关闭