什麼是全文搜尋全文搜尋的方法

  全文檢索是指計算機索引程式通過掃描文章中的每一個詞,對每一個詞建立一個索引,指明該詞在文章中出現的次數和位置,以下是由小編整理關於什麼是全文搜尋的內容,希望大家喜歡!

  全文搜尋的方法

  主要分為按字檢索和按詞檢索兩種。按字檢索是指對於文章中的每一個字都建立索引,檢索時將詞分解為字的組合。對於各種不同的語言而言,字有不同的含義,比如英文中字與詞實際上是合一的,而中文中字與詞有很大分別。按詞檢索指對文章中的詞,即語義單位建立索引,檢索時按詞檢索,並且可以處理同義項等。英文等西方文字由於按照空白切分詞,因此實現上與按字處理類似,新增同義處理也很容易。中文等東方文字則需要切分字詞,以達到按詞索引的目的,關於這方面的問題,是當前全文檢索技術尤其是中文全文檢索技術中的難點。

  全文搜尋的系統

  全文檢索系統是按照全文檢索理論建立起來的用於提供全文檢索服務的軟體系統。一般來說,全文檢索需要具備建立索引和提供查詢的基本功能,此外現代的全文檢索系統還需要具有方便的使用者介面、面向WWW的開發介面、二次應用開發介面等等。功能上,全文檢索系統核心具有建立索引、處理查詢返回結果集、增加索引、優化索引結構等等功能,外圍則由各種不同應用具有的功能組成。結構上,全文檢索系統核心具有索引引擎、查詢引擎、文字分析引擎、對外介面等等,加上各種外圍應用系統等等共同構成了全文檢索系統。

  全文搜尋系統的功能特點

  強大的資訊採集能力

  全文檢索系統是以先進的搜尋技術為核心,並針對專業使用者所要求的搜尋深度深、採集精度高和抓取速度快等進行了專門的優化,採用了分散式多執行緒併發指令執行體系結構,95%資訊分鐘級到達本地。能夠採集多種動態和靜態網頁型別、多種文件、資料庫型別,同時網頁實時增量採集技術實現分秒監測網站資訊變化動態,使網站隨時獲取最新的資訊資源。

  分秒級的實時檢索

  全文檢索系統採用獨有的增量實時索引技術保證資訊即時採集即時檢索,使使用者隨時檢索到行業/地區最新的資訊。

  快速的檢索響應

  全文檢索系統可實現亞秒級的檢索速度以及每秒上百次的併發檢索支援,保證全面快速的響應使用者檢索需求。

  全面的檢索功能

  全文檢索系統可實現全文檢索,完全支援布林邏輯檢索、支援n階漸進檢索、支援同義詞檢索、支援自定義使用者詞典,模糊檢索,相關檢索等,並可以由系統管理員人工過濾不當網頁,為使用者提供最為適當的檢索結果。

  精確的檢索結果

  全文檢索系統採用智慧中文切詞技術,避免中文檢索的歧義與多義現象,同時採用相關性演算法對網頁進行排序,保證檢索相關性最高的頁面放在最前面。

  豐富的檢索結果展示

  全文檢索系統為使用者提供豐富的檢索結果展示,能夠根據每個網站的不同風格和要求定製結果顯示模版。檢索結果包括智慧動態摘要、獨有的網頁快照,以及多種檢索結果排序方式等等。能夠極大的方便使用者對檢索結果的瀏覽檢視,提高使用者對檢索效果的滿意度。

  基於Web的系統管理平臺

  全文檢索系統採用標準的B/S架構,系統管理員可以隨時隨地通過瀏覽器登陸Web管理介面對整個系統的各項功能進行管理和系統維護,操作簡單易用,無需專業培訓即可迅速上手。

全文搜尋的方法