大資料時代的小資料的閱讀答案

大資料時代的小資料的閱讀答案

  【原文】

  “大資料時代”的小資料

  ○1當下,“大資料”是個時髦詞,一會用大資料分析這個,一會用大資料建構那個。似乎大資料無所不能。其實大資料就是一個大到用現有的技術無法處理的資料庫,真正能夠分析大資料的,一定是專業領域的大師,而非尋常眾生。我感興趣的倒是另外一個有趣的概念,那就是“大資料時代”的小資料。

  ○2小資料就是個體化的資料,是我們每個個體的數字化資訊。比如我天天都喝,突然,有天喝完酒了胃疼,那麼這天和之前的每一天有何不同?原來,這天喝的酒是個新牌子,可能這就是導致胃疼的原因。這就是我生活中的“小資料”,它沒有大資料那樣浩瀚繁雜,卻對每個人的個體至關重要。

  ○3第一個意識到“小資料”重要性的是美國康奈爾大學教授德波哈爾·艾斯汀。艾斯汀的父親去年去世了,而早在父親去世之前幾個月,這位計算機科學教授就注意到老人在“數字社會脈動”中性號異常——他不再發送電子郵件,不去超級市場買菜,到附近散步的距離也越來越短。然而,這種逐漸衰弱的狀態,在醫院的心電圖中是看不出來的,這個90歲的老人在檢查時並沒有表現出特別明顯的異常。可事實上,追蹤他每時每刻的個體化資料,他的生活其實已經明顯發生變化。這種日常小資料帶來的生命訊息的警示和洞察,啟發了艾斯汀,他發現小資料可以看作是一種新的醫學證據,它是唯一的“your row of their data”(他們資料中屬於你的那行資料)。

  ○4也許人們都知道,大資料將改變當代醫學,譬如基因組學、蛋白質組學、代謝組學等等,不過由個人數字跟蹤驅動的小資料,同樣可能為個人醫療帶來變革,特別是當可穿戴裝置更成熟後,移動技術將可以連續、安全、私人地收集並分析你的資料,這可能包括你的工作、購物、睡覺、吃飯、鍛鍊和通訊,這些數字追蹤將得到一幅只屬於你的健康自畫像。

  ○5【 】譬如我們可以分析年老父母的整合資料,用於比較不同的醫學治療方案:如果患者想要確定適合自己的服藥劑量,就可以透過數字跟蹤資料前後比較,瞭解不同劑量的藥物對自己日常功能的影響;對於慢性病、抑鬱症、記憶力衰退等病症,日常活動變化的資料同樣非常重要。長期以來,攻克癌症一直使人們的夢想。腫瘤細胞的DNA引起不同的癌症病人非常不同的變化,大致相同的基因變異只佔患者的10%。也就是說即使是同一個腫瘤,其細胞的變異也可能是不同。所以,利用患者的資料進行個性化的癌症治療,不是“對症下藥”,而是“對人下藥”。這些個性化的治療都需要記錄和分析個人行為隨時間變化的規律,所以“小資料”也可以有大作為的。

  ○6有人說,個人小資料匯聚起來不就是大資料了嗎?從大資料裡面取出相關的小資料就可以了嗎?其實不然,小資料是隱私的,不能共享的,而且它是動態的變化的,著些特徵使得小資料不能與大資料混為一談。

  ○7當然,這並不是說大資料就不重要,在醫學上發現某種疾病治療的一般規律都離不開大資料。也就是說,依靠大資料可以得到一些規律或普遍現象,而用小資料小資料去匹配個人,表現個性化特點。不過,大資料流行,大家就只談“大資料”,這顯然不是做學問該有的.態度。(文章有改動,作者閔應驊系中國科學院計算技術研究所研究員)

  【問題】

  14、根據上下文文意的連貫,以下填入第○5段橫線處最恰當的一句話是( )(3分)

  A、的確,小資料可以在很多研究領域中完全替代大資料。

  B、那麼,運用小資料進行研究到底有哪些成功的案例呢?

  C、那麼,肖書記可以為我們提供多少研究的可能性呢?

  D、那麼,小資料和大資料到底哪一個的作用個更突出?

  15、對上文理解正確的一項是( )(3分)

  A、作者認為我們每個個體而言,大資料太過繁雜,小資料卻和我們生活息息相關。

  B、第○3節以艾斯汀父親的例子具體說明了個體化資料因無法檢測而在醫學上價值不大。

  C、根據第○5節所列的資料可知:腫瘤細胞在癌症病人體內發生基因變異的可能性並不大。

  D、第○7節告訴我們:大資料遠比小資料重要,因為藉助它能夠發現疾病治療的規律。

  16、聯絡上下文,第○5節中加點詞語“對症下藥”是指【 】,而“對人下藥”則是指【 】(4分)

  17、結合文字,判斷下列不屬於“大資料”的一項是( )(2分)

  A、小明具有A型血做任何事情都條理分明、十分細心認真的特點。

  B、感冒一般鼻塞、噴嚏、頭痛、咳嗽、咽喉紅腫等明顯症狀。

  C、小寶寶一般4到10個月開始出牙,最晚2歲半出齊全部乳牙。

  D、為了怡情養性,小紅以一杯綠茶代替了原來每天喝的咖啡。

  18、上文花了大量篇幅介紹小資料,那麼題目能否改成“小資料”呢?請作出判斷並簡述兩點理由。(5分)

  答:【 】。(1)【 】;(2)【 】。

  【參考答案】

  14、(3分)C

  15、(3分)A

  16、(共4分,每空2分)針對癌症的一般規律進行治療考慮到每個病人的個體特點,藉助“小資料”進行個性化治療

  17、(2分)D

  18、(共5分)不能改(1分)

  理由(1)從①②④節可知,本文不是簡單地介紹小資料,而是要說明大資料背景下小資料的重要性;

  (2)結合⑥⑦節可知,文章還點出了大資料與小資料在特性功用上的差異;

  (3)從文章的結尾,還可以讀出,作者想要糾正人們對待大資料和小資料的態度。(每點2分,共4分,寫出其中兩點即可,答題時沒有明確從哪些小節得出結論,但分析正確的不扣分)

最近訪問