前面我們眾騰網絡分享了《搜索引擎工作原理之預處理和索引與鏈接關系的計算》,當搜索引擎蜘蛛爬行和抓取網頁之后,會對得到的網頁進行一系列的預處理,最后得到關于網頁的反向索引集合,這時搜索引擎就可以根據用戶輸入的搜索詞對網頁做出排名了。
當然,從用戶輸入搜索詞到搜索引擎展示出相關的網頁排名結果,中間還要經過相當復雜的計算過程!
搜索引擎會對用戶輸入的搜索詞進行分詞處理和去噪,如果對分詞處理和去噪還不是很了解的小伙伴,大家可以到《參考搜索引擎工作原理:預處理這篇文章》,這里就不多做介紹了,當搜索引擎分詞和去噪完畢之后,會得到幾個關鍵詞,然后按照這幾個關鍵詞的邏輯“與”關系到反向索引集合中去進行匹配,比如網友輸入“桂林網站建設”最后會被搜索引擎分詞成“桂林”,“網站”,“建設”這三個關鍵詞,然后再去爬行和抓取的網頁反向索引庫中查找同時包含這三個關鍵詞的頁面,因為這樣得到的網頁相關性更高。
當搜索引擎得到這些網頁之后會發現,這些網頁的數量是相當龐大的,而用于展示在用戶面前的搜索結果頁面不超過1000個,百度也只展示了760個頁面,所以搜索引擎會對這些頁面進行相關性之外的計算,其中影響較大的一個因素就是網頁的權重,根據網頁權重的高低排序會篩選出一批頁面,至于篩選出多少頁面,這里不得而知,但肯定大于1000個頁面。
在選出這些權重較高相關性較強的頁面之后,接下來搜索引擎會對這些頁面進行更加細微的相關性計算,這個過程也是我們seoer更為關心的一個過程,因為這個過程中的很多因素是我們這些seoer可以控制的。
關鍵詞的常見指數,比如用戶搜索“桂林旅游”,經過搜索引擎分詞可以分成“桂林”,“旅游”,我們可以很明顯的看出“旅游”這個詞在我們生活中經常會出現,而“桂林”就出現的比較少了,針對都包含“桂林”和“旅游”關鍵詞的兩個頁面,顯然在標題中出現關鍵詞“桂林”比內容中出現“桂林”的相關性更強。
關鍵詞的頻率及密度,這個比較好理解,如果關鍵詞在頁面中的出現的頻率很高,密度也很大(這里不考慮關鍵詞的堆砌),那么這個頁面和這個關鍵詞的相關性很強。
關鍵詞的位置和表現形式,就像在上面說的搜索引擎工作原理:索引與鏈接關系的計算這篇文章中提到的,關鍵詞的位置和表現形式都會被列入相關性計算中,比如一些標題標簽的使用,文字加粗和顏色變化,H1標簽等。
關鍵詞是否完整匹配,如果關鍵詞能夠完整匹配用戶的搜索詞,則相關性高,即使沒能完整匹配,但是關鍵詞之間距離很短,這樣也會被認為相關性較高。
錨文本和權重,頁面的權重對關鍵詞的相關性影響非常大,而錨文本的重要性與頁面的權重幾乎相當,如果錨文本的錨點采用的是用戶搜索的關鍵詞,那么這個錨文本會給這個關鍵詞帶來很大的鏈接權重,包括錨文本周圍的文字也需要重點布局。
經過以上這些關于頁面與關鍵詞之間相關性計算之后,網頁的排名結果頁就浮出水面了,接下來的工作就是搜索引擎調用頁面的標題,頁面描述,網址,快照等數據顯示在搜索結果頁面中。
我們通過幾篇文章介紹了搜索引擎的工作原理,要想做好網站優化,理解搜索引擎的工作原理還是非常重要的,這樣我們的優化才會更有目的性,希望能對大家有所幫助!