垂直搜尋引擎核心技術研究及展望論文

垂直搜尋引擎核心技術研究及展望論文

  垂直搜尋引擎與計算機領域多個方面的發展與應用息息相關,其關鍵技術更是促進計算機領域進一步發展的重要突破口。所以,對於垂直搜尋引擎關鍵技術的研究具有十分重要的意義。我國計算機領域雖然對垂直搜尋引擎關鍵技術方面進行了一定的研究,並且其研究應用在實際的計算機應用中也取得了十分有效的成績。然而,隨著科學技術的發展,對計算機技術要求不斷提高的同時,對於垂直搜尋引擎的關鍵技術也有了新的要求。因此,在今後的發展中,相關領域的專業人士要加強對垂直搜尋引擎關鍵技術的重視和研究,進而在更大程度上提高垂直搜尋引擎關鍵技術的應用水平。

  一、垂直搜尋引擎概述

  1. 垂直搜尋引擎的概念

  所謂的垂直搜尋引擎實際上就是搜尋引擎的一個分支、是搜尋引擎的細化。也就是說,垂直搜尋引擎所搜尋的資訊更加具有行業性,更加具有專業化。用計算機領域的專業術語來講就是“對網頁庫中的某類專門的資訊進行一次整合,定向分欄位抽取出需要的資料進行處理後再以某種形式返回給使用者”.因而,垂直搜尋引擎更加受到某些專業性、行業性比較強的使用者的歡迎。

  2. 通用搜索引擎與垂直搜尋引擎的不同

  垂直搜尋引擎與通用搜索引擎最大的區別和不同就是對於搜尋資訊範圍的不同。我們從字面上來理解通用二字就可以知道,通用搜索引擎適用於任何一類資訊的搜尋,只不過其缺點就是搜尋的範圍比較大,需要操作者在搜尋之後對資訊進行進一步的篩選。而垂直搜尋引擎則能很好的避免這一問題,其搜尋都是針對於某一行業的專業搜尋,因而能夠在最快的時間內為操作者提供最有效的資訊。從當前社會的發展來看,人們對計算機要求的不斷提升,相信這種垂直搜尋引擎將會受到越來越多人的喜愛。

  二、垂直搜尋引擎的關鍵技術

  從上述分析中可知,垂直搜尋引擎是計算機領域中的一個發展重點,並且垂直搜尋引擎相比於通用搜索引擎而言,更加適合於未來人們對計算機應用的需要。所以,對垂直搜尋引擎關鍵技術的研究勢必要提上日程。筆者在此主要從以下幾個方面對垂直搜尋引擎的關鍵技術進行了研究,希望以下這些研究能夠為垂直搜尋引擎關鍵技術的研究發展提供一些參考。

  1. 網路爬蟲技術

  網路爬蟲技術是垂直搜尋引擎中一項十分重要的關鍵技術,該技術是一種能夠自動抓取網頁程式的技術,因而是搜尋引擎中的重要組成成員。而也是這一重要地位決定了網路爬蟲技術工作流程的複雜性。該技術在具體的工作過程中是需要對網頁進行大量的分析後,來丟掉每一個與搜尋資訊無關的連線,與從同時,將分析後留下的連線在放入等待抓取的地方,進而進行下一步的抓取與篩選。

  廣度優先和深度優先是網路爬蟲技術的兩個策略,兩種策略以其各自的優勢為該技術的應用提供便捷。此外,在使用網路爬蟲技術的過程中,還需要意識到一點,即每一個被該技術抓取的網頁都將會被計算機的系統儲存,並且這些網頁會透過多個方面的分析和過濾後建成相應的索引。

  2. 網頁資訊抽取技術

  所謂的`網頁資訊抽取技術指的就是用網頁作為資訊源頭,在網頁中搜索計算機使用者需要的或者是感興趣的資訊。網頁資訊抽取技術的優勢是其所搜尋出的資訊經過了多個方面的處理,將原有網頁上的資訊處理的更具有結構化、清晰化,切格式也比較統一。現有的網頁資訊抽取技術主要有三種抽取方法:基於自然語言處理的方式、基於包裝器歸納的方式、基於 HTML 結構的資訊抽取。三種方法都為垂直搜尋引擎做出了突出的貢獻。並且隨著未來電子商務領域的不斷髮展,這種網頁資訊抽取的搜尋引擎方法將發揮更大的應用價值。

  3. 中文分詞技術

  除了以上兩種垂直搜尋引擎關鍵技術外,中文分詞技術也是最為常用的一種垂直搜尋引擎技術。該種技術對於文字的處理速度是十分快速的,而該種技術也是由於其快速性被廣泛的應用。中文分詞技術的方法有很多,如基於字串的匹配、基於統計的方法等,都是垂直搜尋殷勤中的重要方法。然而,在實際中文分詞技術的應用中,由於網路語言發展的比較快,各種新穎的網路新詞層出不窮,而這一點也成為了中文分詞技術應用的重要挑戰。

  三、垂直搜尋引擎的發展空間

  從上述垂直搜尋引擎關鍵技術的研究中我們可以發現,當前的關鍵技術的應用已經取得了很大的成就,並且隨著關鍵技術的進一步研究,將會有越來越多的行業意識到垂直搜尋引擎價值性。同時,隨著當前市場發展的多元化、專業化,垂直搜尋引擎這種適合專業性、行業性領域發展的技術勢必會在未來的搜尋行業中佔有舉足輕重的地位,並且將計算機領域的發展推向另一個高潮。

  以上僅僅只是筆者對於垂直搜尋引擎關鍵技術的幾個主要方面的分析,然而,事實上,其關鍵技術涉及的方面比較多,再加之筆者對於垂直搜尋引擎方面的研究能力有限,因而僅僅憑藉以上對於垂直搜尋引擎關鍵技術的研究來促進該方面技術的發展和應用是遠遠不夠的。因此,對於垂直搜尋引擎關鍵技術的研究還有待進行進一步的探索。

  四、結語

  綜上所述,對於垂直搜尋引擎關鍵技術的研究不僅僅有利於提高該技術在計算機領域的進一步應用,同時更有利於促進計算機領域的全面發展。然而,垂直搜尋引擎關鍵技術的研究涉及的內容比較多,並且每一項關鍵技術都十分複雜,再加之垂直搜尋引擎相關領域工作人士對於其關鍵技術的研究還沒有達到一定的深度和廣度,因而不利於實際關鍵技術的應用和發展。所以,在今後垂直搜尋引擎領域的發展中,要加強對其關鍵技術的重視和研究,並且要從其關鍵技術的多個角度、多個方面進行分析,從而研究出更好、更有利於促進垂直搜尋引擎關鍵技術應用與發展的方法與措施。

  參考文獻:

  [1] 王曉偉 . 垂直搜尋引擎若干關鍵技術的研究 [J]. 浙江大學學報 ,2007,(5)。

  [2] 李副銘 . 垂直搜尋引擎的研究與設計 [D]. 電子科技大學學報 ,2009,(9)。

  [3] 劉世濤 . 簡析搜尋引擎中網路爬蟲的搜尋策略 [J]. 阜陽師範學院學報 ,2006,(9)。

最近訪問