科學計量學視野下的《傲慢與偏見》的研究策略論文

科學計量學視野下的《傲慢與偏見》的研究策略論文

  作為在2007年3月1日世界圖書日調查中位居英國人“生命中不可或缺”的百部著作之首,並且在英國被列為最暢銷的長銷書之一的英國19世紀著名女作家簡·奧斯丁(Jane Austen,1775—1817)的小說《傲慢與偏見》[1],在中國學界同樣備受關注。從1998年至今,僅在中國學術期刊網收錄的文章就有450多篇,這些文章用不同的文學評論方法,從不同的角度,不同的視野,對《傲慢與偏見》進行了較為深入的探討。中國學術期刊網的資料還顯示,從2006年開始,國內對《傲慢與偏見》的研究文章增量迅猛,呈現出強勁的上升趨勢。那麼,在這十多年來,國內對《傲慢與偏見》的研究主要觸及了哪些研究主題及領域?其主要研究力量的分佈狀況、研究水平及整體概況如何?對這些研究現狀的探討應該是相關學者和研究機構所普遍關心的問題,但經中國學術期刊網文獻檢索查閱,國內在這方面的研究論文竟呈空白狀態!透過更大範圍的文獻檢索進一步發現,國內從宏觀層面對諸如某個文學研究領域的研究現狀進行全面、深入、客觀的研究和評價的文獻少之又少,尤其是從定量、實證角度來分析和評價的研究文獻就更為鮮見。可以說目前文學研究界還普遍缺乏這樣一種意識,即用定量的方法對某個文學研究領域的整體狀況做出比較客觀和系統的描繪與判斷。因此,為對目前國內《傲慢與偏見》研究的現狀進行必要的梳理、總結與反思,本研究擬利用先進的計算機資料探勘技術,從科學計量學的角度,綜合運用詞頻分析、共詞分析、社會網路分析及資訊視覺化等方法,對國內十多年來在此方面的研究進行計量分析,側重於揭示其研究的產出模式及研究主題結構,以期較全面地展示目前國內對該作品的研究狀況。同時,也藉此在文學研究領域引進一種新的研究方法——以詞頻統計和知識圖譜方法為核心的科學計量方式,並以此來探討引進其他學科的研究方法進行全新視角的交叉學科、跨學科文學研究的可能性及前景。目前,這些研究方法已應用於其他很多學科[2-3]。

  1 研究方法與資料收集

  1.1 研究方法

  本研究的基本方法為:利用先進的計算機資料探勘技術,綜合運用詞頻分析、共詞分析、社會網路分析、資訊視覺化等科學計量學方法,對論文研究主題的分佈,論文發表的年代及作者、機構與期刊分佈等進行計量分析和視覺化識別。本研究主要採用了Execl詞頻統計法、共詞分析法和社會網路分析法等方法[4]。

  1.1.1 共詞分析法

  共詞分析法(co-word analysis)是當今科學計量學、文獻計量學的最重要工具之一。其基本原理是:若兩個能表達某一學科領域研究狀況的專業術語在同一文獻中出現,則表明這兩個專業術語之間必然存在著一種內在的關係,且出現頻次愈高就表明它們之間的關係愈密切,或者說愈相似。這種專業術語可以是論文的作者、關鍵詞,也可以是作者的機構或期刊名等。

  1.1.2 社會網路分析

  社會網路分析(social network analysis)廣泛應用於工業工程、社會行為科學、經濟學和營銷學中。將它用於文獻計量學研究,則可透過社會網路分析中的中心性、中介性和K核等概念,找出具有重要地位的論著、作者、機構或關鍵詞之間的互動關係,發現其結構和特徵等。本研究社會網路分析軟體採用netdraw[4]。

  1.2 資料收集

  本研究的資料採集方法為:選擇中國學術期刊網全文資料庫,在“關鍵詞”和“篇名”欄中輸入“傲慢與偏見”。匹配選擇“精確”;時間選擇1998—2009年,然後剔除其中不屬於規範的研究性質的文章,並對個別詞彙的用法進行了適當的統一,如將“奧斯汀”統一調整為“奧斯丁”等,最後得到458篇相關論文的資訊,內容包括論文的題名、作者、機構、關鍵詞、發表期刊、發表時間等(本研究資料收集時間為2010年5月15日)。

  2 研究結果

  2.1 研究的產出模式

  2.1.1 論文總量分析

  1998—2009年中國學術期刊網收錄的論文總數為458篇,歷年的論文數參見圖1。

  圖1資料表明,國內對《傲慢與偏見》的研究在2006年前一直比較平穩,除了2004年忽增至34篇外,其餘年份基本保持在每年10~20篇之間;從2006年開始,論文數量呈現大幅度上升趨勢,後三年年均論文發表量保持在80~100篇之間。由此可見,學術界對《傲慢與偏見》的研究呈趨熱狀態。

  2.1.2 所發表的期刊分佈

  統計顯示,458篇論文分佈在291種期刊中,其中發表1篇的期刊有220種,發表2篇的期刊有44種,發表3篇的期刊有9種,發表4篇的期刊有5種,發表5篇及以上的期刊共有12種(表1)。

  圖1 1998—2009年間發表的研究論文數

  Fig.1 Total amount of research papers during 1998-2009

  對發表論文最多的前12種期刊的來源做一個統計分析,發現主要有四類期刊:

  第一類是科技教育類學術期刊。如《科技資訊(學術研究)》《文教資料》《科教文匯(中旬刊)》等,其中《科技資訊(學術研究)》更是以發表14篇論文高居榜首。文學類研究論文居然更多地在科技教育類學術期刊中被髮表,這實在是一個值得關注的奇怪現象。究其原因,這可能和可供文學類研究論文發表的論文期刊相對較少,而每年因為各種原因(如有的是確有研究心得,有的是為了評職稱,有的是為了獲得畢業證書,有的是為了完成科研工作任務等)而產出的眾多論文又必須找到一個出口有關。不難想象,這些論文往往質量不高。

  第二類是文學和文學研究類期刊。如《安徽文學(下半月)》《時代文學(理論學術版)》《名作欣賞》《外國文學研究》等。估計這和一些以前的純文學期刊為了求生存和發展現在基本都設有文學學術研究類版面有關,這樣做的結果是解決了一部分文學研究類論文的出路。這裡值得一提的是,國內的`外國文學研究核心期刊《外國文學研究》,也以發表論文總數5篇列在前12位,可見國內的外國文學研究領域對奧斯丁作品的研究也十分關注。不過令人遺憾的是,進一步的查詢發現,發表在《外國文學研究》的研究論文,均為2004年以前,近幾年則再沒有關於《傲慢與偏見》研究的論文在此刊物上被髮表。筆者推測,這和近些年來雖然關於作品研究的論文數量上升很快,但其論文質量不高,並且在研究內容和方法上沒有新的突破不無關係。

  第三類是大學學報類期刊。如《赤峰學院學報(漢文哲學社會科學版)》《和田師範專科學校學報》《牡丹江大學學報》等,這些處於偏遠省份的高等院校學報為什麼會成為很多研究者發表該類論文的優先選擇?或許還有一些值得進一步思考和分析的因素。

  第四類是影視類期刊。如《電影評價》《電影文學》等。《傲慢與偏見》的研究論文被較多地發表在影視類期刊應該說不會讓人感到奇怪,因為自從1940年美國好萊塢的米高梅公司首次把《傲慢與偏見》改編成電影作品以來,奧斯丁的每部作品都被改編成電影,並不斷地被重拍。而每次電影的熱映,又反過來促進了文學作品的流傳,並引起了更多人的關注。因此,《傲慢與偏見》的研究同樣被影視類期刊所青睞。

  2.1.3 作者數量的統計

  統計論文第一作者,資料顯示共有第一作者393位,其中發表1篇論文的作者有348位,2篇論文的作者有37位,3篇論文的作者有6位,4篇論文的作者有2位。這表明,從整體上看,研究《傲慢與偏見》的隊伍較龐大,但考慮到又有88.5%的作者只發表了一篇研究論文,可見《傲慢與偏見》雖引起研究者廣泛注意,但對其進行長期研究的並不多。進一步的查詢顯示,發表相關研究4篇論文的兩位高產作者分別是泉州師範學院的林文琛教授和河北經貿大學的秦嵐講師。林文琛教授早在20世紀80年代就開始研究奧斯丁作品,撰寫了一系列奧斯丁作品研究的論文,其中共有8篇在研究外國文學的核心刊物《外國文學評論》和《外國文學研究》上發表,在國內外同行中產生了較大影響;而秦嵐從2007年開始發表研究奧斯丁作品的論文,三年間發表了4篇,可謂是新生代研究者。再從作者的身份看,他們基本上都是各高等院校外語學院的英語教師,可見在高校外語教師中奧斯丁的作品擁有極高的關注度。而從作者的性別看,則又發現以女性教師居多。

  2.1.4 作者所在單位的分佈

  對論文第一作者的所在單位進行統計,可以得到各單位的論文產出量。湖南師範大學以7篇位居第一,泉州師範學院以6篇位居第二,安徽大學、廣東外語藝術職業學院、河西學院、華中師範大學、解放軍外國語學院、四川大學各以5篇並列第三,安陽師範學院、河北經貿大學、南京師範大學各以4篇排列其後。從發表論文數列國內較前面的這些單位可看出,關注奧斯丁《傲慢與偏見》的主要是各師範類、外語類和擁有外國文學學科的相關院校。

  2.2 關鍵詞統計和論文的主題分佈

  2.2.1 主要關鍵詞

  統計論文關鍵詞,458篇論文中有385篇論文給出了關鍵詞,不同關鍵詞用詞共679個,總使用頻次為1470次。其中只使用1次的有523個,使用2次的有78個,使用3次的有29個,使用4次的有10個,表2列出了頻次在5次及以上的前39個關鍵詞。

  由表2可看出,這些關鍵詞既“分散”又“集中”。說“分散”,是因只使用了1次的關鍵詞就有523個,佔所有關鍵詞數的77%,這除了說明關鍵詞的標註本身沒有統一標準,因此多詞一義的現象比較普遍之外,也在一定程度上反映了十多年來《傲慢與偏見》研究中業餘研究佔較大部分的特點。說它“集中”,則是指表2的高頻關鍵詞中,反映“婚姻和愛情”主題的關鍵詞和反映作品“寫作風格”的關鍵詞都不少,而且使用頻次都不低。

  2.2.2 主要關鍵詞共現圖譜

  為進一步反映十多年來國內《傲慢與偏見》研究的主題結構,採用共詞分析、社會網路分析法對這些關鍵詞做圖譜分析。具體方法為:先選擇頻次不少於2次的關鍵詞(共156個,即認為在十多年裡至少有2篇論文中均出現過此關鍵詞),然後計算它們中任意兩個關鍵詞在所有論文中同時出現的次數,並將共詞計算所獲得的資料用社會網路分析中的netdraw軟體進行視覺化,由此得到圖2。圖2中的每個頂點代表一個關鍵詞,頂點大小代表該關鍵詞使用的頻次,頂點愈大說明其出現頻次愈高;頂點間的連線代表這兩個詞出現在同一論文中的情況,線條粗重的,代表它們共同出現在同一論文中的次數愈多,反之則愈少。

  圖2 1998—2009年國內《傲慢與偏見》研究的主題結構圖譜

  Fig.2 Theme structure chart of Pride and Prejudice in domestic China during 1998-2009

  觀察圖2,可以很明顯地得到以下結論:

  1)不計書名《傲慢與偏見》和作者名字簡·奧斯丁,讀圖可見這十多年來《傲慢與偏見》的研究主要是圍繞“婚姻”“愛情”“婚姻觀”等關鍵詞展開,這顯然和簡·奧斯丁作品的永恆主題“婚姻”相一致。她在作品中透過其塑造的女性形象來反映她的愛情和婚姻理念,在她看來,理想中的婚姻關係應該是感情、物質、道德和理智的綜合體。與之相對應,學者們在研究其作品時,重點在於探討作者在作品中所反映的愛情觀和婚姻觀。從圖2中還可看出,把關鍵詞“婚姻”“愛情”“婚姻觀”聯結在一起的一個“橋樑型”或可稱“中間型”的關鍵詞是“金錢”,談婚姻、愛情自然離不開“金錢”,當然還有“財富”“財產”和“社會地位”,因此,探討作者和作品中人物形象的“金錢”觀也是研究者繞不開和感興趣的話題。

  2)以圖2最大的頂點書名《傲慢與偏見》為中心進行分析,研究結果顯示:聯結它另一個頂點的高頻關鍵詞分別是“簡·奧斯丁”“婚姻”“婚姻觀”“愛情”“情感”“婚戀觀”“反諷”“言語反諷”“諷刺”“情節”“女性形象”“合作原則”“言語行為理論”“會話含義”“性格”《簡·愛》《紅樓夢》等,歸類以上這些關鍵詞,基本上為“婚姻情感”類和“文學創作技巧、特色”類。分析表明,很多研究者從藝術創作手法上對簡·奧斯丁作品進行了探討,並認為“反諷”“言語反諷”“諷刺”是其作品的主要藝術特色,研究者認為奧斯丁把這種“反諷”技巧靈活地運用在對作品中人物的塑造、情節的安排,以及所描寫作品女性形象的婚姻、愛情中,以此來評判當時以追求金錢為目的的婚姻觀念;再看圖2中出現18次的“合作原則”這一高頻詞,剛開始分析時筆者一時也很難判斷其準確含義,透過查閱論文庫相關研究論文得知:有一些學者藉助美國哲學家H. P. Grice於1976年提出的“會話含義理論”(Grice認為,在所有的語言交際活動中為了達到特定的目標,說話人和聽話人雙方都應遵守一種原則,他稱這種原則為會話的合作原則Cooperative Principle,簡稱CP)[5],以作品中人物對話對於“合作原則”的遵循與悖逆為切入點來分析作品中人物的性格特徵,嘗試運用語用學的理論對文學作品進行分析,探討語用學運用於文學批評領域的可行性與意義(對“合作原則”這個高頻詞的研究分析令人欣喜地驗證了“知識圖譜方法是可能可以自動地發現知識的”這一功能)。另外,《簡·愛》《紅樓夢》的出現,則表明近年來還有一些研究者已把奧斯丁作品和英國另一19世紀著名女作家夏洛蒂·勃朗特的《簡·愛》,以及中國古代四大名著之一曹雪芹的《紅樓夢》進行了對比研究,研究視角有了進一步的拓展。

  3)再以另一個頂點作者名字“簡·奧斯丁”為中心進行分析發現,聯結它另一個頂點的高頻關鍵詞分別是“傲慢與偏見”“傲慢”“偏見”“女性主義”“女性意識”“女性”“伊麗莎白”“英國文學”“理智”“金錢”“財富”“財產”“婚姻”“婚姻觀”“愛情”等,這表明,撇開前面已論述的“婚姻愛情是研究的主要主題”不談,近年來許多研究者還從“女性主義”的視角來解讀奧斯丁的《傲慢與偏見》,認為其在英國文學中,作為女性文學的先驅,以其敏銳的女性視角,將備受冷落和歧視的女性帶入了人們的視野,透過對婦女的地位、權利、稟賦等問題的理性思考,奧斯丁在男權文化傳統下努力構建起女性文學的王國,從而走出了以男權思想為中心的男權傳統的樊籬,表達出明確的女性意識、前衛的婚姻觀念和深刻的思想內涵[6]。從女性主義研究視角出發,研究者認為奧斯丁透過她塑造的女主人公伊麗莎白消除她認為的因為社會地位差異而對她傲慢無禮的男主人公達西的誤會和偏見,最終締結美滿婚姻來展現她理想、前衛的婚姻觀:戀愛婚姻與財產和社會地位相關,但又不完全取決於財產和社會地位,幸福的婚姻應當建立在相互愛慕相互尊重的基礎上,為了財產、金錢和地位而結婚是錯誤的,而結婚不考慮上述因素是愚蠢的。

  4)仔細觀察圖2的其他一些關鍵詞,並透過查閱論文庫原文,還可發現:有一些論文已開始從語用學的角度、敘事學的角度、文學文體學的角度、翻譯的角度、跨媒體批評的角度、跨文化批評角度去研究該作品,但從總量看這類論文還不是很多,尚處在研究的初始階段,但也預示著這些方面有可能是今後研究發展的方向。

  3 基本結論和對該方法的進一步討論

  綜上所述,本研究藉助現代化的計算機資料探勘技術,從科學計量學的角度,綜合運用詞頻、共詞、社會網路分析及資訊視覺化等科學計量學的方法,對十多年來國內《傲慢與偏見》研究做了主要側重於揭示該研究領域產出模式及研究主題結構的計量分析,獲得了一些較為客觀有益的研究結論。如就研究主題而言,研究發現:目前國內對《傲慢與偏見》的研究主題較為集中,主要是在對作品的婚姻愛情觀和創作技巧方面的討論;就產出模式而言,則發現了一些值得進一步思考的問題,如發表論文的期刊結構問題,核心研究隊伍的培養問題等;同時也略微探討了今後研究的一些可能發展方向。這些研究結論將有助於學者瞭解國內目前《傲慢與偏見》的研究現狀和未來走向。

  將進一步討論的是,作為一種新的文學研究方法的引入,作為一種交叉學科、跨學科研究的探索性嘗試,是否合適和如何做到合適的問題。因為,本研究採用的這種定量研究的基本方式,也許會令一些讀者懷疑:第一,感性的文學作品研究是否可以用圖形、列表、統計等量化的方法來評價,文學界是否能接受這種新穎的研究方法;第二,如果可以引進這類研究方法,那麼在使用時又應注意哪些問題。

  第一個問題是隨著資訊時代的來臨,“應用資訊手段解決資訊時代的各種問題”(包括人文社會科學的監測和評價)已成為“可能”和“必須”。說“必須”是因為,計算機技術與網路技術的結合,既為科學研究開闢了一條通往新資訊源和交往物件的通道,極大地改變了科學研究的手段和方法,但同時也要求科研工作者必須提高對海量資訊的檢索、選擇、管理和評價的能力,否則就會如同在絕對的光明中和在絕對的黑暗中一樣,什麼也看不見[7]!而從本研究所使用的科學計量學方法和所要研究的問題直接結合的背景看,這種方法既“可能”又“可行”。對一個領域的研究進行研究主題和水平、產出模式、研究整體概況及特徵的評估,事實上是一種學術史的研究,而學術史的研究顯然既可以採用定性研究方法也可以採用定量研究方法,且最好是同時使用這兩種方法,因為這兩者既各有側重又各有利弊,更無法以一種方法去取代另一種方法。再具體到一個問題,如對於一些宏觀性、整體性問題的研究來說,如果單憑個別專家的定性判斷顯然難免會有所偏頗,而隨著資料庫的完善和資料探勘技術的成熟,對這一類問題可以採取更為全面和客觀的文獻計量學方法。誠然,使用定量研究方法仍免不了它的侷限,如學科性質的軟硬、定量的困難、資料庫可能存在的偏差等,但這些應該都不是文學研究領域嘗試使用這些方法的障礙。

  第二個問題,即使用時需注意的問題,應高度注意以下幾點:

  一是基於文獻資料庫的文獻計量(知識挖掘)是一項綜合性的,需要團隊合作才能做好的工作。因為從過程看,它包括獲得充足而可靠的資料、掌握一套先進的計算機知識挖掘軟體、有一套適合的文獻計量框架體系、能夠理解使用者的需求等多個環節,這些環節中缺了哪一個都會直接影響到研究的質量,但要同時做好這麼多環節,掌握這麼多知識,單靠個人的力量顯然是比較困難的。如本研究就是一個分工合作、學科交叉的結果。本研究第二作者主要負責“方法和資料”部分,第一作者則主要負責“文學角度的資料解讀”,正因為有兩個不同專業人士的合作,才完成了本項研究。

  二是對“資料庫”的高度熟悉。文獻計量研究是一項用資料發言的研究,一分資料一分結論,無資料就無結論。因此資料的正確性非常重要,這就必須要求研究者對資料庫非常熟悉,對資料的來源做到心中有數,否則極易發生偏差而得出錯誤結論。

  三是對資料的解讀要慎之又慎。計量研究的目的不是為了統計而統計,不是單純為了“論文的表述”而表述,而是為了“發現問題”。因此,對資料的解讀是一項重要工作。但“資料”本身往往義是抽象的、脫離了原來語境的一種“符號”,因此要對它進行正確解讀,就必須要求研究者多多回到“原文”中去檢驗或者去尋找和發現它的意義,可以說沒有經過這兩者之間的多次往復運動和迭代,是很難做好這類研究的。

  4 結語

  綜上,本研究嘗試並探討了在文學研究領域引入詞頻、共詞、社會網路分析及資訊視覺化等科學計量學方法,進行跨學科、交叉學科研究的可能性和運用前景及應注意的若干問題,獲得了一些較新的研究成果。作為一種文學研究領域全新視角研究方法的探索,本研究不敢說拋磚引玉,但卻期望引起相關領域研究專家和學者的進一步關注和思考。

最近訪問