• 客服
    咨詢
  • 公告3
  • 關注

    關于時代 更多優(yōu)惠活動等您來拿!
    寶雞網絡公司微信 掃一掃關注——微信公眾號 時代手機瀏覽 掃一掃立即手機瀏覽
  • 關閉
  • 頂部
  • 搜索引擎建立自然搜索引擎庫

    時間:2012-07-04 22:37 來源:未知

      迄今為止,蜘蛛程序已經爬過了網頁,搜索引擎已經分析了網頁的標記和文本。下一步是創(chuàng)建搜索索引庫,一個特別設計的

    數據庫,搜索引擎用它來為任何搜索請求快速查找匹配的網頁。
      
      一個搜索引擎“想起”什么詞在哪個網頁,是通過把詞和網頁存儲在搜索索引庫中。
      
      在最簡單情況下,一個搜索索引庫有一個含有每一個詞的記錄,跟著是含有這個詞的所有網頁的列表。因此,當在Google搜

    索“青光眼”的時候,Ooogle搜索引擎查看它的索引庫,先找到“青光眼”的記錄,再找到網頁的列表。
      
      當一個搜索引擎正在創(chuàng)建搜索索引庫,它檢查蜘蛛程序發(fā)現(xiàn)的每個網頁中那些獨特的詞,檢查每一個詞是否已在索引庫中存

    有記錄。如果有記錄,就在記錄的末尾加上這個網頁的研址(URL)。如果沒有記錄,那么一個包含有那個網址的新記錄控創(chuàng)建。

    現(xiàn)在,實際的地址會占據索引庫的大量空間,因此搜索引擎將每個網址轉換成一個獨特的數字,也存儲在索引庫中。
      
      搜索引擎額外地儲存關于每個頁面的元數據(metadata).用以顯示搜索結果。因此,它存儲了網址,標題,和任何必要的信

    息摘要(能夠顯示出哪里找到的搜索項)。這樣,當這條記錄需要被顯示為搜索結果的時候,所有的信息已經在其索引中了。