商務資訊檢索與利用的實驗報告範文

商務資訊檢索與利用的實驗報告範文

  實驗專案名稱:網路商務資訊檢索與利用

  實驗目的:

  (1)瞭解利用網路進行資料檢索的基本思路。

  (2)掌握利用網路進行資料檢索的主要方法。

  實驗情況及實驗結果:實驗(1)檢索期刊篇章多使用搜索引擎的“網頁搜尋”功能,檢索報載資料主要使用“新聞搜尋”並輔以網頁搜尋功能。通常而言,新聞搜尋引擎(或搜尋引擎的新聞檢索)所指的“新聞”,絕非新聞學特指的狹義的“新聞”,而是報載資料(廣告除外)的集合稱謂。在檢索實踐中,凡查詢報載資料,專業人員大都會首先使用新聞搜尋引擎或搜尋引擎的新聞搜尋功能。

  目前國內最為著名和常用的新聞搜尋引擎是百度(http://news.baidu.com/)和中國搜尋(http://www.chinasearch.com.cn/index-news.htm)。

  百度新聞搜尋引擎是“世界上最大的中文新聞搜尋平臺,每天釋出80000--100000條新聞,新聞來源包括500多個綜合和地方新聞網站、專業和行業網站、政府部門和組織網站、報刊雜誌廣播電視媒體網站”。百度新聞每5分鐘對網際網路上的新聞進行自動更新,並根據內容為每篇新聞提供一個地區屬性,據此可以檢索全國34個省市自治區的即時地方新聞(http://news.baidu.com/location.html)。

  由中國搜尋發起的中國搜尋聯盟是一個以搜尋引擎應用為核心的開放型聯合體,聯盟的協議成員已發展到1000餘家,幾乎包括了所有的國家與省級報刊網站,以及有一定訪問量的地方與行業報刊網站。中國搜尋的“第三代智慧搜尋引擎”每十分鐘更新一次新聞內容,是“是目前全球資料更新頻率最高的中文搜尋引擎”之一。

  由於二者的搜尋技術不同,其語法功能、對搜尋詞的要求亦有些許差異,搜尋結果的頁面要素也各有特色,而資訊來源和更新頻率不同則必然導致同一詞語檢索,二者搜尋結果的不同,或此多彼少,或此有彼無、或彼此重複。因此,二者需配合使用,以儘可能避免漏檢和重複,保證搜尋結果的儘可能全面。

  1.有針對性地選擇搜尋引擎

  用不同的搜尋引擎進行查詢得到的結果常常有很大的差異,這是因為它們的設計目的和發展走向存在著許多的不同,比如:dejanews(http://www.dejanews.com)是專用於usenet的搜尋引擎,而liszt(http://www.liszt.com)則是針對郵遞列表、irc等的搜尋引擎。

  2.逐步細化法

  按照搜尋引擎的分類一層一層地點選下去,這對一些關鍵字不太確定的資料查詢十分有效。yahoo把網上的各種資料歸類整理,分得很細,有休閒與運動、娛樂、健康與醫藥、藝術與人文等很多類別,而且有每一大類的連結進入後分成很多小類,一層一層地進入連結,分類也就越來越細,離你的目標也就越來越近。由於都是連結形式,所以使用起來又方便又簡單,不用我多說了吧。

  3.根據要求選擇查詢方法

  如果需要快速找到一些相關性比較大的資訊,可以使用目錄式搜尋引擎的查詢功能,如使用yahoo(http://www.yahoo.com)。如果想得到某一方面比較系統的資源資訊,可以使用目錄一級一級地進行查詢。如果要找的資訊比較冷門,應該用比較大的全文搜尋引擎查詢,如altavista(http://www.altavista.digital.com/)或hotbot(http://www.hotbot.com/

  4.注意細節

  在internet上進行查詢時如果能注意一些細節問題,常常能增加搜尋結果的準確性,如許多搜尋引擎都區分字母的大小寫,因此,如果您正在搜尋人名或地名等關鍵詞,應該正確使用它們的大小寫字母形式。

  5.利用搜索引擎的特性進行查詢

  不同的搜尋引擎有一些專用的特性,應用它們可以使查詢事半功倍,比如:若想知道某個新聞組上最近一段時間發表的文章,可以在dejanews的查詢框中輸入"~g組名",例如"~gcomp.lang.java.programmer"。

  6.使用多元搜尋引擎

  多元搜尋引擎是一種只需輸入一次關鍵詞就可以對多個搜尋引擎進行查詢的.搜尋代理網站,如searchspaniel(http://www.searchspaniel.com/)就可以同時對200多個搜尋引擎進行查詢。

  7.利用選項界定查詢

  目前越來越多的搜尋引擎開始提供更多的查詢選項,利用這些選項人們可以輕鬆地構造比較複雜的搜尋模式,進行更為精確的查詢,並且能更好地控制查詢結果的顯示。

  8.儘可能將搜尋範圍限制在特定的領域裡

  比如:在yahoo中文網站中,你要查詢的是與電腦相關的知識,那麼你沒有必要讓搜尋引擎在休閒與運動、健康與醫藥、藝術與人文等其他分類中查詢。你可以進入“電腦與因特網”這一類,選中“檢索此目錄下的網站”。

  9.使用更特定的詞彙

  比如,不用“服裝”,而用“西服”;不用“flower”而用“rose”。但要儘可能刪去一些同義詞或近義詞。

  10.指定關鍵詞出現的欄位

  在關鍵詞前加t:,搜尋引擎將僅在網站名稱中查詢,即只顯示在網站名稱中包含關鍵字的網站。

  在關鍵詞前加u:,搜尋引擎將僅在網址(url)中查詢。

  11.限制查詢範圍

  範圍限制的能力越強,則越能準確地找到需要的資訊。搜尋引擎提供的範圍限制類型大體有分類範圍、地域範圍、時間範圍、網站類型範圍以及其他特殊範圍。一些搜尋引擎,提供了許多特殊範圍的限定,如域名字尾(com、gov、org等)、檔案型別(文字、圖形、聲音等)。這些範圍限制、實現的方法各不相同:有些是透過在關鍵詞前加特殊的字元,有些是透過下拉式選單。

  12.儘量少用空格

  在輸入漢字作關鍵詞的時候,不要在漢字後追加不必要的空格,因為空格將被認作特殊運算子,其作用與and一樣。比如,你輸入了這樣的關鍵詞“電腦”,那麼它不會被當作一個完整詞“電腦”去查詢,由於中間有空格,會被認為是需要查出所有同時包含“電”“腦”兩個字的文件,這個範圍就要比“電腦”作關鍵詞的查詢結果大多了,更重要的是它偏離了本來的含義。

  13修改ie瀏覽器的預設搜尋引擎

  在ie4.0/ie5.0的工具欄上,點選“搜尋”圖示,ie就會呼叫預設的搜尋引擎excite為你檢索。要想改變預設的搜尋引擎,你必須改動win98的登錄檔。ie4.0修改方法是:關閉ie,開啟登錄檔編輯器,找到[hkey_current_usersoftwaremicrosoftinternetexplorermain],在右側窗格中雙擊“查詢”,輸入要改變的預設搜尋引擎網址,例如把預設搜尋引擎改為google,此時就鍵入http://www.google.com/。

最近訪問