在經歷過一系列的預處理后所留下的獨特的文章就是可以反映主題的內容,搜索引擎會把這些記錄下來做成一個集合,記錄在頁面上出現關鍵詞的頻率,出現了多少次,出現的格式比如是黑體還是標題標簽或者是錨文本等信息,然后是位置比如是開頭段還是中間段落,或者是尾端,詞頻格式權重的等信息全部記錄再按西鞥成一個對應的文件ID。做完了這些還不可以直接拿來用作排名資料,比如說有個用戶搜索SEO,那么程序就需要找出所有ID,然后挨個掃描。找出相關比例和權重最大的那個網站,無疑這樣的做的負擔兩是沉重的。所以為了減輕工作量搜索引擎會倒索引,也就是找出所有包含這個關鍵詞的文章,然后再在按照之前的預處理做出一反應后在根據網站現在的權重做出排名。

