因此,人们对谁最初提出了 TrustRank 的想法产生了一些困惑。此外, 2009年授予谷歌的“信任等级”专利描述的流程与 2004 年原始论文中描述的流程截然。
现在,下 2004 年提出的 TrustRank 的想法,以及搜索引 玻利维亚 数字数据 擎如何使用它来计算信任。 让我们从这个简单的图表开始: 从左边开始,如果你想象你有一个 100% 信任的网站列表,其中可能包括 BBC、CNN、纽约时报等网站。
这个“种子列表”上没有任何垃圾邮件,因为这些都是具有高水平编辑控制权的高质量网站。当我们向右移动一步时,我们首先得到一个距离可信徽章集有一个链接的网站列表。垃圾邮件的数量有时会略有增加,但不会太多。
向兰德致敬،感谢他的原创理念. 现在移至图表的最右侧,我们可以看到,如果网站列表距离受信任的徽章集仅三个链接,则该列表中的网站更有可能是垃圾邮件 - 事实上占 14%。
因此,搜索引擎可以定义自己的可信网站徽章集,并将其作为抓取网络的起点。当他们爬行这些网站并跟随外部链接时,他们可以看到任何给定网站与受信任徽章集的距离。这意味着网站越偏远,就越有可能是垃圾网站。