一若自学网

谷歌算法

HITS算法在SEO中的详细讲解及运用

2021年2月10日4谷歌算法
HITS算法在SEO中的详细讲解及运用

HITS算法是用户输入关键词后,算法会对返回的匹配页面计算两种值,一种是枢纽值(Hub Scores),另一种是权威值(Authority Scores),这两种值是互相依存、互相影响的。

这里要注意两点,枢纽值(Hub Scores)和权威值(Authority Scores),它们是构成HITS算法的两个基础定义,我们简称为:Hub和Authority页面。

Hub页面:指的是包含了大量的高质量Authority页面链接的网页;

Authority页面:指的是与某个领域或者某个话题相关的高质量页面。

HITS算法不同于其他的搜索引擎链接分析算法,HITS算法原理是通过强调页面与页面之间的关于形成的一个有效的SEO排序算法,更多的是强调枢纽页面与权威页面之间的关系,从而提升网页与网页之间的信任度,然后达到提升页面质量排名的目的。

算法基本思想:相互增强关系

基本假设1:一个好的“Authority”页面会被很多好的“Hub”页面指向;

基本假设2:一个好的“Hub”页面会指向很多好的“Authority”页面;

HITS具体算法:可利用上面提到的两个基本假设,以及相互增强关系等原则进行多轮迭代计算,每轮迭代计算更新每个页面的两个权值,直到权值稳定不再发生明显的变化为止。

搜索引擎的目标:更全、更快、更准;HTIS算法则属于“更准”环节。

同属于“更准”环节的包括百度超链接算法和谷歌PR算法,它们都是一种链接分析算法。

HITS算法讲解

HITS算法存在的问题

HITS算法整体而言是个效果很好的算法,目前不仅应用在搜索引擎领域,而且被“自然语言处理”以及“社交分析”等很多其它计算机领域借鉴使用,并取得了很好的应用效果。尽管如此,最初版本的HITS算法仍然存在一些问题,而后续很多基于HITS算法的链接分析方法,也是立足于改进HITS算法存在的这些问题而提出的。

归纳起来,HITS算法主要在以下几个方面存在不足:

1.计算效率较低

因为HITS算法是与查询相关的算法,所以必须在接收到用户查询后实时进行计算,而HITS算法本身需要进行很多轮迭代计算才能获得最终结果,这导致其计算效率较低,这是实际应用时必须慎重考虑的问题。

2.主题漂移问题

如果在扩展网页集合里包含部分与查询主题无关的页面,而且这些页面之间有较多的相互链接指向,那么使用HITS算法很可能会给予这些无关网页很高的排名,导致搜索结果发生主题漂移,这种现象被称为“紧密链接社区现象”(Tightly-Knit CommunityEffect)。

3.易被作弊者操纵结果

HITS从机制上很容易被作弊者操纵,比如作弊者可以建立一个网页,页面内容增加很多指向高质量网页或者著名网站的网址,这就是一个很好的Hub页面,之后作弊者再将这个网页链接指向作弊网页,于是可以提升作弊网页的Authority得分。

4.结构不稳定

所谓结构不稳定,就是说在原有的“扩充网页集合”内,如果添加删除个别网页或者改变少数链接关系,则HITS算法的排名结果就会有非常大的改变。

HITS算法与PageRank算法比较

HITS算法和PageRank算法可以说是搜索引擎链接分析的两个最基础且最重要的算法。从以上对两个算法的介绍可以看出,两者无论是在基本概念模型还是计算思路以及技术实现细节都有很大的不同,下面对两者之间的差异进行逐一说明。

1.HITS算法是与用户输入的查询请求密切相关的,而PageRank与查询请求无关。所以,HITS算法可以单独作为相似性计算评价标准,而PageRank必须结合内容相似性计算才可以用来对网页相关性进行评价;

2.HITS算法因为与用户查询密切相关,所以必须在接收到用户查询后实时进行计算,计算效率较低;而PageRank则可以在爬虫抓取完成后离线计算,在线直接使用计算结果,计算效率较高;

3.HITS算法的计算对象数量较少,只需计算扩展集合内网页之间的链接关系;而PageRank是全局性算法,对所有互联网页面节点进行处理;

4.从两者的计算效率和处理对象集合大小来比较,PageRank更适合部署在服务器端,而HITS算法更适合部署在客户端;

5.HITS算法存在主题泛化问题,所以更适合处理具体化的用户查询;而PageRank在处理宽泛的用户查询时更有优势;

6.HITS算法在计算时,对于每个页面需要计算两个分值,而PageRank只需计算一个分值即可;在搜索引擎领域,更重视HITS算法计算出的Authority权值,但是在很多应用HITS算法的其它领域,Hub分值也有很重要的作用;

7.从链接反作弊的角度来说,PageRank从机制上优于HITS算法,而HITS算法更易遭受链接作弊的影响。

8.HITS算法结构不稳定,当对“扩充网页集合”内链接关系作出很小改变,则对最终排名有很大影响;而PageRank相对HITS而言表现稳定,其根本原因在于PageRank计算时的“远程跳转”。

HITS算法对seo的应用

相信很多做百科的小伙伴,都会遇到一个问题,需要权威网站的相关参考页面,很多人都会因此去购买新闻源发软文。

那这个参考页面有啥用?

除了考虑到对该词条的信息补充,从HITS算法角度考虑。

添加其他权威网站的相关参考页面,有利于帮助该词条的百科页面,成为一个Hub页面;与此同时,因为百科页面本身丰富的内容,它同属于一个高质量的Auhority页面。

这就是我们上面有提到的,两者互相影响,互相增强,并非独立关系。

HITS算法在网站SEO中的利用

该算法对于国内搜索引擎而言,具有一定的缺陷,也正是一些缺陷影响了搜索引擎结果排序。从而可以利用HITS算法的缺陷进行网站优化。比如由于HITS的主题漂移,即使你发布的外链是不相关的,也会提升网页主题的推荐度,从而提升网页关键词排名。其次,HITS算法由于是归属于链接分析算法,该算法不仅仅是强调外部链接的重要性,同样也强调内部链接的重要性,如站内网页A信任度高,站内网页B包含内页A的链接,也会间接性提升网页B的权重,这也是为何很多时候做排名优化的页面没有排名,反倒引起了没有优化的页面参与了排名。具体运用到SEO中有一下几点。

1、高质量参考页面的引用

在编辑文章的时候,特别是想写高质量文章,不要吝啬你的导出链接,可以适当的引用其他高质量的相关页面。

注:需要说明一点,很多做黑帽SEO的人员做垃圾网页,就喜欢利用这一点作弊。因为一个页面导出到高质量的页面,它属于Hub页面。

而垃圾页面其实质内容可能是些Huang/du/du,同时又输出链接到Auhority页面,这会提高页面自身的Hub分值,混淆蜘蛛的判断。

2、高质量的外链建设

排除那些使用工具日发百万外链,如果你无法做到这么多;请你相信,多做些高质量的外链,好过花时间去发垃圾链接。

3、Auhority页面更重要

虽然HITS算法会分析页面的两个分值,然而对于搜索引擎来说,Auhority值更重要。不难理解,毕竟Auhority页面是实实在在的内容输出。

4、可以利用HITS枢纽页面与权威页面之间的关系提升排名卡位现象,比如排名第三页,可以利用该方式有少许排名提升;

5、可以利用HITS的主题漂移原理带动其他页面之间的排名,比如优化页面带动没有优化的页面排名。

精智wordpress免费主题

专注、用心,做简洁实用的WordPress中文主题。

精智wordpress主题