搜羅各大搜索引擎算法 - "知彼知己,百戰(zhàn)不殆"
來(lái)源: http://www.cxkw.com.cn | 時(shí)間:2019.04.28 | 瀏覽數(shù):257
HITS 算法是由康奈爾大學(xué)( Cornell University ) 的Jon Kleinberg 博士于1997 年首先提出的,為IBM 公司阿爾馬登研究中心( IBM Almaden Research Center) 的名為“CLEVER”的研究項(xiàng)目中的一部分。
按照HITS算法,用戶輸入關(guān)鍵詞后,算法對(duì)返回的匹配頁(yè)面計(jì)算兩種值,一種是樞紐值(Hub Scores),另一種是權(quán)威值(Authority Scores),這兩種值是互相依存、互相影響的。所謂樞紐值,指的是頁(yè)面上所有導(dǎo)出鏈接指向頁(yè)面的權(quán)威值之和。權(quán)威值是指所有導(dǎo)入鏈接所在的頁(yè)面中樞紐之和。
一個(gè)網(wǎng)頁(yè)重要性的分析的算法。通常HITS算法是作用在一定范圍的,比如一個(gè)以程序開(kāi)發(fā)為主題網(wǎng)頁(yè),指向另一個(gè)以程序開(kāi)發(fā)為主題的網(wǎng)頁(yè),則另一個(gè)網(wǎng)頁(yè)的重要性就可能比較高,但是指向另一個(gè)購(gòu)物類(lèi)的網(wǎng)頁(yè)則不一定。
在限定范圍之后根據(jù)網(wǎng)頁(yè)的出度和入度建立一個(gè)矩陣,通過(guò)矩陣的迭代運(yùn)算和定義收斂的閾值不斷對(duì)兩個(gè)向量Authority和Hub值進(jìn)行更新直至收斂。
HITS算法的最大缺點(diǎn):
它在查詢階段進(jìn)行計(jì)算,而不是在抓取或預(yù)處理階段
所以HITS算法是以犧牲查詢排名響應(yīng)時(shí)間為代價(jià)的
也正因?yàn)槿绱嗽糎ITS算法在搜索引擎中并不常用
不過(guò)HITS算法的思想是進(jìn)入到了搜索引擎的索引階段
也就是根據(jù)鏈接關(guān)系找出具有樞紐特征或權(quán)威特征的頁(yè)面
成為權(quán)威頁(yè)面是優(yōu)先考慮的,不過(guò)難度比較大
唯一的方法就是獲得高質(zhì)量鏈接
當(dāng)你的網(wǎng)站不能成為權(quán)威頁(yè)面時(shí)就讓它成為樞紐頁(yè)面
所以導(dǎo)出鏈接也是當(dāng)前搜索引擎排名因素之一