關於大資料預測高考作文題的分析

關於大資料預測高考作文題的分析

  語文專家:押中題未必能得高分

  隨著大資料時代的到來,用大資料預測今年的高考題成為不少資訊供應商的噱頭之一,其中以百度預測最為引人關注,尤其是其押中了今年高考作文上海卷的自由主題,讓不少網友喜出望外,表示媽媽再也不用擔心我的高考作文了!到底大資料壓題靠不靠譜呢?

  高考作文押中題一直是不少考生的夢想。進入雲計算時代,用大資料來預測高考作文題成為今年不少資訊科技公司的主攻物件,甚至有大資料庫號稱押中今年高考12道作文題。

  大資料庫提供六命題方向

  今年高考前夕,百度預測推出了高考作文預測專案,記者登入百度預測網站,就可以開啟高考作文預測頁面,頁面上出現一個類似蜂巢般的圖表,分成六大色塊,每一個色塊都代表今年高考作文最有可能的命題方向,每個色塊均有一個主題,並配有命中百分比資料的分析,包括時間的饋贈(28.61%)、生命的多彩(15.80%)、民族的變遷(14.99%)、教育的思辨(14.58%)、心靈的堅守(14.03%)和發展的困惑(11.99%)。根據這六大方向分別配有8~9個不同的`關鍵詞,點選這些關鍵詞就會出現3篇例文,再次點選例文,就會和百度搜索聯絡在一起,直接檢視例文和相關素材。

  根據這一預測,百度宣佈這一預測專案成功押中今年全國18道高考作文題中的12道,如時間的饋贈,關鍵詞為依舊和記憶,對應今年高考作文題中,江蘇卷和廣東卷的作文題目分別為什麼是不朽、膠片與數碼時代。而生命的多彩中,直接給出了關鍵詞自由,幾乎完全和今年上海作文題穿越沙漠的自由和不自由契合,而青春一詞也在江蘇卷中提到。

  百度預測方面認為,這次預測充分展示了大資料的神奇之處,命中率之高令人難以想象。

  挖掘8年海量資料做預測

  據百度大資料專家介紹,此次預測高考作文題是百度挖掘了近八年各個省市的高考真題和模擬題,並且結合了近些年的搜尋風雲熱點和新聞熱點資料,根據當年社會思想的關注與潮流,現有資料和實時資料相結合組成百度作文預測的大資料庫,並在它們與高考命題之間建立關聯;而後,百度大腦將前面提到的大資料進行智慧分析,透過機率主題模型演算法模擬人腦思維,反向推匯出作文主題及關聯詞彙,從而進行主題預測,提供關鍵詞、機率以及範題和素材。

  專家稱,這種海量資料的分析對於一個每天需要響應幾百億次搜尋的門戶搜尋網站來說,技術上並不算什麼,主要是如何透過資料進行分析,所以表面上看,命題者的思路千變萬化,毫無頭緒,但是一旦放到海量資料下面進行分析,命題的個人意志一定會受到社會各種因素和資訊的影響,大資料預測者就是要找到這個可能影響命題者思路的變數因素,而這中間的規律和軌跡又不是個體命題者能夠和察覺的。

  考生:上百範文等於沒押題

  今年參加高考的考生小利也告訴記者,實際上,所謂押題只能是把所有的希望押在幾道題上,然後透過背誦文章、背誦結構和材料,確保寫出高分作文,如果像大資料庫這樣提供了四五十個關鍵詞,每個關鍵詞又有3篇例文和大量素材,這樣算下來就是100多道作文題,如果給你100多道作文題就不叫押題,直接叫複習而已,因為給出的可能性太多,其實可以忽略不計了,因為實際高三也會複習到大量作文題。

  真正好的作文題不怕押中

  陳慶雯老師坦言自己從不會讓學生押題,以不變應萬變才是最重要的,而且真正好的作文題並不怕人家押中。

  華南師範大學文學院教授柯漢琳也表示,用大資料押題不但能讓考生看到,也會讓命題者看到,不排除命題者為了避免和大資料分析碰車特意另闢蹊徑,而且就算是沾邊押中了部分關鍵詞,能不能得到高分仍是未知數,這些年作文題思辨性越來越強,幾乎難有標準結論和答案,即便是範文可能也會因為缺乏新意而無法得到高分。

  陳慶雯老師表示,押中完全一樣的作文題的機率並不高,如果學生自己沒有理解、分析能力,似是而非的去生搬硬套材料和範文,閱卷老師一般都能看出來,不但不會得到高分,甚至可能因為沒有寫出自己的真情實感而獲得低分,不如擴大閱讀面,儲備更多的知識,這才是寫好高考作文的制勝法寶。

最近訪問