識組織系統下文獻檢索體系建設與驗證論文

識組織系統下文獻檢索體系建設與驗證論文

  基於知識組織系統的文獻檢索操作,是當前數字圖書館領域文獻檢索方式的研究熱點方向之一,也是圖書館文獻資訊的需求者與提供者之間對文獻資源進行的互操作行為。在文獻檢索過程中,如何更加合理地透過對知識組織系統的運用,提高文獻檢索的全面性和準確性,已成為當前文獻資訊檢索的關鍵問題。

  當前,基於知識組織系統的文獻檢索方式主要是從文獻關鍵詞的語義角度出發,透過基於分類表和敘詞表及知識本體的文獻檢索、基於文獻關鍵詞的標引和分詞檢索、基於關鍵詞的語義檢索以及敘詞表重構式檢索等檢索方式,以自動化標引為檢索手段,實現的文獻檢索服務。其中,藉助敘詞表中的概念語義關係擴充套件與精化的使用者檢索式,是各種網路資訊檢索工具提高其檢索效能的常用方法。

  此類文獻檢索服務以查閱、概念檢索、詞彙歸納等文字內容為核心,主要體現在文獻資訊的關鍵詞語義擴充套件檢索和文獻資訊的大眾分類法的檢索兩種模式上。基於文獻資訊的關鍵詞語義擴充套件檢索模式,主要透過分析文獻資訊的關鍵詞自身概念與語義概念間的關聯性,並對文獻資訊關鍵詞自身的詞性進行標註,突出文獻資訊關鍵詞的核心概念與語義,再借助關鍵詞自身概念與語義概念的關聯,實現基於關鍵詞本體的文獻資訊語義檢索。語義檢索能處理資訊的語義內容,實現基於語義的匹配和推理。該檢索方式突出了文獻資訊中核心概念與文獻資訊關鍵詞語義的串聯,並將文獻資訊的核心價值透過文獻的關鍵詞標引進行充分的體現,使得檢索結果與文獻資訊需求的關聯度大幅增加,減少了使用者需要篩選的檢索結果數量,提升了檢索的速率,提高了檢索結果的準確度。而基於大眾分類法的文獻檢索與傳統分類法相比,更加註重檢索者的檢索習慣,透過依照知識組織分類法處理各項文獻和檢索使用者自定義的自由詞作為數字資源標註整理,實現檢索與瀏覽的功能,使得檢索過程更加便捷有效。

  現階段,對獨立建立的知識組織系統的對映和服務協議是實現知識組織系統互操作的主要方式。當前,基於知識組織系統的文獻檢索研究主要是透過將關鍵詞語義和文獻分類法與文獻的關聯為基礎,實現類似將分類主題詞表和元資料整合在一起構造一個知識網路並在其上實施知識瀏覽和概念檢索。這種檢索模式在一定程度上提高了文獻檢索的便捷性和全面性。

  但在當前文獻涵蓋面廣、涉及領域雜的文獻環境中,資源組織體系不規範,造成基於文獻關鍵詞語義和文獻分類法關聯的檢索模式缺乏科學的導航體系和完善的管理平臺進行關聯性檢索操作,使得文獻資訊需求者在文獻檢索過程中無法對文獻關鍵詞的擴充套件和標引進行正確的控制;同時,跨語言互換過程中語料庫的無法實時更新,使得檢索結果的準確性和全面性受到影響;以及搜尋引擎績效評價較少,使得檢索的過程效率無法得以明確的體現。針對當前所面對的問題,筆者提出了一種個性化的基於知識組織系統的文獻檢索體系構造,旨在以概念格、本體、資料探勘、語義標註等理論與技術的互補融合為基礎理念,形成滿足檢索使用者需求為前提的檢索操作,並透過對體系個性化、關聯性、評定反饋及安全性 4 個方面的構造,實現全面性和準確性的個性化文獻檢索活動。

  1 基於知識組織系統的文獻檢索體系模組

  基於知識組織系統的文獻檢索的運作目的,在於使資訊需求者能夠透過自身資訊需求的提取和檢索,實現全面準確的目的性檢索。同時,概念格、本體、資料探勘、語義標註等操作技術的運用,實現了基於知識組織系統的文獻檢索體系的構建。

  而基於知識組織系統的文獻檢索模組,主要由資訊需求模組、關聯執行模組、評價反饋模組和安全保障模組 4 個部分組成。

  1。1 資訊需求模組

  資訊需求模組在文獻檢索體系中的設立,主要是用來完善合理的文獻檢索使用者的檢索需求,使文獻檢索使用者在檢索過程中,能夠針對自身的檢索需求進行文獻檢索活動,提高檢索的效率以及檢索結果的利用價值。圖 1 為資訊需求模組結構圖。

  文獻檢索使用者是個性化文獻檢索活動的主體。要明確文獻檢索使用者的核心需求,需要先明確使用者的需求主題和關鍵詞,並透過對文獻需求指標的關聯和分析,明確使用者的直接需求和潛在需求,同時也明確自身需求資訊存在的屬性與載體形式。

  在個性化文獻檢索活動中,使用者的需求指標是檢索的核心要素。而如何建立完善合理的個人資訊指標體系,明確使用者的各項資訊需求在檢索指標中的界定標準,體現檢索指標的各個環節、體現使用者自身的資訊需求,就成為當前確定使用者文獻檢索需求的關鍵點。透過資訊需求模組的設定可以看出,個人使用者在檢索需求指標的選取上具有針對性和全面性。

  1。2 關聯執行模組

  關聯執行模組體系結構一共有 4 個組成部分,分別為使用者的核心需求、需求主題的內在關聯、需求關鍵詞的內在關聯以及關聯中樞。圖 2 為關聯執行模組結構圖。

  檢索關聯執行模組的核心,在於透過對檢索使用者核心需求的提取和分析,標註其需求主題和需求關鍵字,同時對檢索使用者需求主題中客戶的潛在需求和直接需求的判定,以及需求關鍵詞體現相關需求的屬性和載體分析,實現檢索使用者需求的整體體現,並透過關聯中樞的關聯與整合,實現檢索使用者相應需求之間的互操作執行。在檢索關聯執行過程中,知識組織系統針對使用者檢索的相應所需,透過知識資料整合與互操作技術實現文獻資料間的'關聯,並透過關聯因子得出需求資訊的關聯資料。

  1。3 評定反饋模組

  評價反饋模組體系是對文獻檢索結果的綜合評定,具體由檢索結果的全面性、有效性、準確性和利用率 4 部分組成。圖3為評定反饋模組結構圖。在評定反饋體系執行中,將檢索到的結果分別在使用者檢索需求和使用者需求環境中進行全面性、有效性、準確性和利用率的評定,並透過等級的劃分實現資訊檢索結果價值的體現。

  檢索結果的等級指標體系是檢索結果的核心價值體現,因此,評價反饋模組中各個具體評定指標的確立和執行,使得檢索結果的針對性得以充分的體現。

  1。4 安全保障模組

  安全保障體系是透過將文獻檢索過程中各項資訊保安環節融合並組成的安全保障體系,其具體可以體現在資訊保護體系和安全保障體系兩個主要部分。

  資訊保護體系主要是對使用者在文獻檢索過程中的個人需求進行安全保護,具體是透過對使用者的資訊需求提取操作過程中使用者需求關鍵字的挖掘整理來實現;安全保障體系負責對體系的整體執行進行操作,主要是透過對檢索結果進行安全策略的分析與實施,並在體系執行過程中設定安全效果的反饋,用以保持和完善使用者安全保障模組的執行。圖 4 為安全保障模組圖。

  在基於知識組織系統的文獻檢索體系中,安全保障模組執行的核心在於透過將使用者的個人資訊以及檢索到的各類需求資訊,透過資訊清理、分析以及安全加密管理,實現資訊的安全保障。資訊保安保障體系是資訊檢索過程中用於保障使用者資訊保安的重要環節。資訊保安保障體系旨在為使用者的個人資訊以及從外界透過資訊檢索所蒐集到的資訊提供安全保障,避免洩密事件的發生。因此,檢驗資訊保安保障體系是否具有可行性的關鍵,在於該體系能否解決各種客觀環境下日益加劇的資訊保安漏洞,實現對使用者個人資訊的安全保障。

  2 基於知識組織系統的文獻檢索體系構建與驗證

  2。1 基於知識組織系統的文獻檢索體系構建

  基於知識組織系統的文獻檢索運作機制的核心,在於資訊需求者是否能夠透過模組實現資訊的全面性和準確率。圖 5 為基於知識組織系統的文獻檢索體系圖。

  在基於知識組織系統的文獻檢索體系中,資訊需求者將自身的資訊需求透過資訊需求模組進行提取,並在安全保障模組中對提取的資訊各項需求進行整合歸納,透過將整合的資訊在關聯執行模組中進行關聯和檢索,並將檢索的結果透過安全保障模組進行呈現的同時,利用評價反饋模組在安全保障模組下實行結果評價和反饋,完成資訊需求者所需的資訊獲取。

  2。2 實驗驗證

  (1)資訊需求。以歷史為需求的大類目,篩選以下 5 條文獻需求資訊:需求資訊 1———史學類相關文獻;需求資訊 2———文學類文獻;需求資訊 3———中國現代研究文獻;需求資訊 4———史料記載研究類文獻;需求資訊 5———魯迅方面相關研究文獻。

  將上述 5 條需求資訊進行關鍵詞提取,所提取的關鍵詞見表 1。

  在資訊需求模組中,需求資訊的關鍵詞分別提取為史學、文學、中國現代研究、史料記載和魯迅研究;再透過關鍵詞合併需求關鍵詞,整合出需求資訊:中國現代文學史料研究之魯迅方面相關研究文獻。

  (2)關聯執行。透過資訊需求的整合操作,可將資訊需求者的需求資訊歸納為:中國現代文學史料研究之魯迅方面相關研究文獻。再透過關聯執行模組,將需求資訊提取為:中國現代文學史料研究、魯迅研究文獻兩個方面。在執行過程中,關聯執行模組將中國現代文學史料研究匯入文獻檢索系統過程中進行檢索。表 2 為中國現代文學史料研究檢索結果呈現表。

  再透過將“魯迅研究文獻”作為二次檢索條件放入已檢索的關聯結果中,可得檢索結果:中國現代文學史料研究舉隅:魯迅、郭沫若、高長虹及相關研究。

  (3)評價反饋。將關聯執行模組的結果放入反饋評價模組中,並將檢索的結果與 5 條文獻需求資訊進行比對評價反饋,確定結果的全面性、有效性、準確性和利用率。表 3 為評價反饋評定表。

  3 未來發展展望

  當前,文獻資訊主要以網狀結構分佈於知識組織體系中。為了適用文獻資訊的動態性調整,注重知識組織中文獻資訊的挖掘獲取,基於知識組織系統的檢索已逐步形成一套概念性的個性化檢索體系,該體系建立在文獻資訊多樣化的基礎上,透過減少資訊的重複分析,提高檢索效率和檢索質量。在基於知識組織系統的文獻檢索過程中,檢索需求者需要透過對資訊點的實時更新,並根據自身的需求設定檢索方向,實現使用者在檢索操作過程中的完善便捷服務。

  在知識組織系統工具與資訊檢索功能結合起來所形成的基於知識組織系統的文獻檢索模式中,智慧化的檢索、分析和處理體系的特點和優勢,符合當前檢索的發展需求,是未來檢索領域的研究熱點。而如何將基於知識組織系統的文獻檢索與當前文獻檢索服務相結合,更好地體現其操作的便捷性和檢索結果的有效性,是接下來我們研究的主要方向。

  參考文獻

  [1] 薛春香。網路環境中知識組織系統構建與應用研究[M]。南京:東南大學出版社,2009。

  [2] 董慧,唐敏。語義檢索在 Web2。0 環境下的應用探討[J]。中國圖書館學報,2011(3):115—119。

  [3] 王軍,張麗。網路知識組織系統的研究現狀和發展趨勢[J]。中國圖書館學報,2008(1):65—69。

  [4] 王軍。基於分類法和主題詞表的數字圖書館知識組織[J]。中國圖書館學報,2004(3):70。

  [5] 蔡箐。 學科資訊門戶及其最佳化途徑[J]。 中國圖書館學報,2008(4):114—118。

  [6] 馬志傑。我國搜尋引擎評價研究的現狀、問題及對策[J]。圖書館學研究,2013(4):11—17。

  [7] 滕廣青,畢強。知識組織體系的演進路徑及相關研究的發展趨勢探析[J]。中國圖書館學報,2010(9):49—53。

最近訪問