勤學勵志文章

　　勤學是我們每個人最應該做到的習慣，那麼都有哪些呢?一起來看看吧。

　　：深度學習是什麼

　　作者：獵豹CEO傅盛

　　人工智慧，就好像第四次工業革命，正從學術界的私藏，轉變為一種能夠改變世界的力量。尤其，以深度學習取得的進步為顯著標志。它讓匍匐前進60年的人工智慧一鳴驚人。我們正降落到一片新大陸。深度學習帶來的這場重大技術革命，有可能顛覆過去20年網際網路對技術的認知，實現技術體驗的跨越式發展。

　　那麼，深度學習到底是什麼?怎麼理解它的重要性?

　　我們先從概念和現象入手。我總結了一句話，學術上看未必嚴謹，但從我的理解角度看——深度學習是基於多層神經網路的，海量資料為輸入的，規則自學習方法。

　　這裡包含了幾個關鍵詞：

　　第一個關鍵詞叫多層神經網路。

　　深度學習所基於的多層神經網路並非新鮮事物，甚至在80年代被認為沒前途。但近年來，科學家們對多層神經網路的不斷演算法優化，使它出現了突破性的進展。以往很多演算法是線性的。而這世界上大多數事情的特徵是複雜非線性的。比如貓的影象中，就包含了顏色、形態、五官、光線等各種資訊。深度學習的關鍵就是通過多層非線性對映將這些因素成功分開。

　　那為什麼要深呢?多層神經網路比淺層的好處在哪兒呢?

　　簡單說，就是可以減少引數。因為它重複利用中間層的計算單元。我們還是以認貓為例好了。它可以學習貓的分層特徵：最底層從原始畫素開始學習，刻畫區域性的邊緣和紋;中層把各種邊緣進行組合，描述不同型別的貓的器官;最高層描述的是整個貓的全域性特徵。它需要超強的計算能力，同時還不斷有海量資料的輸入。特別是在資訊表示和特徵設計方面，過去大量依賴人工，嚴重影響有效性和通用性。深度學習則徹底顛覆了“人造特徵”的正規化，開啟了資料驅動的“表示學習”正規化——由資料自提取特徵，計算機自己發現規則，進行自學習。

　　你可以理解為——過去，人們對經驗的利用，靠人類自己完成。在深度學習呢?經驗，以資料形式存在。因此，深度學習，就是關於在計算機上從資料中產生模型的演算法，即深度學習演算法。

　　問題來了，幾年前講大資料，以及各種演算法，與深度學習有什麼區別呢?

　　過去的演算法模式，數學上叫線性，x和y的關係是對應的，它是一種函式體現的對映。但這種演算法在海量資料面前遇到了瓶頸。國際上著名的ImageNet影象分類大賽，用傳統演算法，識別錯誤率一直降不下去，上深度學習後，錯誤率大幅降低。在2010年，獲勝的系統只能正確標記72%的圖片;到2012年，多倫多大學的 Geoff Hinton利用深度學習的新技術，帶領團隊實現了85%的準確率。2015年的ImageNet競賽上，一個深度學習系統以96%的準確率第一次超過了人類人類平均有95%的準確率。

　　計算機認圖的能力，已經超過了人。尤其影象和語音等複雜應用，深度學習技術取得了優越的效能。為什麼呢?其實就是思路的革新。

　　舉幾個腦洞大開的例子。

　　先說計算機認貓。我們通常能用很多屬性描述一個事物。其中有些屬性可能很關鍵，很有用，另一些屬性可能沒什麼用。我們就將屬性被稱為特徵。特徵辨識，就是一個數據處理的過程。傳統演算法認貓，也是標註各種特徵去認。就是大眼睛，有鬍子，有花紋。但這種特徵寫著寫著，有的貓和老虎就分不出來，狗和貓也分不出來。這種方法叫——人制定規則，機器學習這種規則。

　　深度學習方法怎麼辦呢?直接給你百萬張圖片，說這裡有貓，再給你上百萬張圖，說這裡沒貓。然後再訓練一個深度網路，通過深度學習自己去學貓的特徵，計算機就知道了，誰是貓。

　　第二個例子是谷歌訓練機械手抓取。

　　傳統方法肯定是看到那裡有個機械手，就寫好函式，move到xyz標註的空間點，利用程式實現一次抓取。而谷歌現在用機器人訓練一個深度神經網路，幫助機器人根據攝像頭輸入和電機命令，預測抓取的結果。簡單說，就是訓練機器人的手眼協調。機器人會觀測自己的機械臂，實時糾正抓取運動。所有行為都從學習中自然浮現，而不是依靠傳統的系統程式。

　　為了加快學習程序，谷歌用了14個機械手同時工作，在將近3000小時的訓練，相當於80萬次抓取嘗試後，開始看到智慧反應行為的出現。據公開資料，沒有訓練的機械手，前30次抓取失敗率為34%，而訓練後，失敗率降低到18%。這就是一個自我學習的過程。

　　有人問了，深度學習，能學習寫文章嗎?

　　來看這個例子。斯坦福大學的計算機博士andrej kapathy曾用托爾斯泰的小說《戰爭與和平》來訓練神經網路。每訓練100個回合，就叫它寫文章。100個回合後，機器知道要空格，但仍然有亂碼。500個回合後，能正確拼寫一些短單詞。1200個回合後，有標點符號和長單詞。2000個回合後，已經可以正確拼寫更復雜的語句。

　　整個演化過程是個什麼情況呢?以前我們寫文章，只要告訴主謂賓。而以上過程，完全沒人告訴機器語法規則。甚至，連標點和字母區別都不用告訴它。不告訴機器任何程式。只是不停將原始資料進行訓練，一層一層訓練，最後輸出結果——就是一個個看得懂的語句。一切看起來都很有趣。人工智慧與深度學習的美妙之處，也正在於此。

　　我還去矽谷看過一家公司——完全顛覆以往的演算法，利用深度學習實現影象深度資訊的採集。

　　眾所周知，市面上已經有無人機，可實現人的跟蹤。它的方法是什麼呢?一個人，在影象系統裡，一堆色塊的組合。通過人工的方式進行特徵選擇，比如顏色特徵，梯度特徵。拿簡單的顏色特徵舉例：比如你穿著綠色衣服，突然走進草叢，就可能跟丟。或，他脫了件衣服，幾個人很相近，也容易跟丟。此時，若想在這個基礎上繼續優化，將顏色特徵進行某些調整，是非常困難的。而且調整後，還會存在對過去某些狀況不適用的問題。

　　總之，這樣的演算法需要不停迭代，迭代又會影響前面的效果。而矽谷這個團隊，利用深度學習，把所有人腦袋做出來，只區分好前景和背景。區分之後，背景全部用數學方式隨意填充，再不斷生產大量背景資料，進行自學習。只要把前景學習出來就行。

　　據我所知，很多傳統方法，還在採用雙目視覺。用計算機去做區域性匹配，再根據雙目測出的兩個匹配的差距，去推算空間另一個點和它的三角位置，從而判斷離你多遠。可想而知，深度學習的出現，使得很多公司辛苦積累的軟體演算法直接作廢了。“演算法為核心競爭力”，正在轉變為，“資料為核心競爭力”。技術人員必須進入新的起跑線。

　　最後再舉個例子。

　　大家都做過胃鏡。尤其胃痛，很痛苦。腸胃鏡要分開做，而且小腸看不見。有一家公司出了一種膠囊攝像頭。吃進去後，在你的消化道，每5秒拍一幅圖，連續攝像，此後再排出膠囊。所有關於腸道胃部的問題，全部完整記錄。但醫生光把那個圖看完，就需要五個小時。原本的機器主動檢測漏檢率高，要醫生複查。後來，他們採用深度學習。採集8000多例圖片資料灌進去，用機器不斷學，不僅提高診斷精確率，減少了醫生的漏診，以及對稀缺好醫生的經驗依賴。只需要靠機器自己去學習規則。

　　深度學習演算法，可以幫助醫生作出決策。

　　瞭解完深度學習，接著思考一個問題——20世紀70年代末80年代初，個人電腦突飛猛進時，人工智慧的商業化卻步履維艱。喬布斯曾這樣定義個人計算機的價值——“它是我們思維的自行車”。那麼，今天的人工智慧呢?深度學習呢?它給我們真正帶來的東西是什麼?未來，對行業和社會有什麼影響?中國公司的機會在哪?

　　：學習的捷徑從模仿和重複開始

　　作者：劉思言

　　最近終於有能量去拾起以前丟下的興趣愛好。由於時間關係，只能買書自學。也有在微博上關注一些水彩大觸。仔細研究發現，他們開班教授的水彩課，大都一個模式。就是老師先示範一遍怎麼畫，然後學生再按照老師的步驟，去把老師畫過的畫重新畫一遍。如果一遍不行，達不到預期效果，那就重複多遍。

　　這種學習方法，適用於很多地方。據我觀察，我們的人生經歷中，有很多課程都是通過這種方法所習得。

　　最早先的時候，當我們還是襁褓中的嬰兒，又或是牙牙學語的幼兒，我們所有的行為模式，包括脾氣性格，都是在模仿大人。我們會模仿大人說話，走路，做動作。也會學到大人不好的行為習慣。

　　在動物界，成年的動物也會教授幼年動物捕獵技巧，生存技能。所有的教授，都是讓幼年的動物模仿自己。通過一遍一遍的模仿，最終變成自己所掌握的技能。

　　這些是因為肌肉具有記憶效應。同一種動作重複多次以後，肌肉就會形成條件反射。所以英語學習中常說的語感，其實也是一種肌肉記憶。通過不斷練習模仿，模仿標準發音，重複閱讀，使肌肉和舌頭形成條件反射，以此來增強我們的語感。

　　所以一開始學習英語的時候，老師都會教我們如何朗讀，也會讓我們去聽英語原聲磁帶。還有一些同學是喜歡聽VOA和BBC這樣的英文廣播，或是去聽一些英語演講，比如美國總統就職演說一類的，還有些同學喜歡看原聲電影或電視劇。所有這些，都是一個模仿的過程。當我們的發音還不那麼標準的時候，我們就通過去模仿那些標準的發音，來糾正自己。同時也提高了我們自己的聽力水平。

　　同樣適用的還有畫畫和書法。我至今都清楚地記得小學三年級的時候，學校搞了個畫畫比賽。我回家對著家裡的年畫年年有魚畫了一幅。是一個穿著紅肚兜的中國傳統娃娃騎坐在一條大紅色錦鯉身上，特別喜慶。那是我第一次認認真真地畫完一幅畫。我儘量模仿年畫的樣子，儘量百分百地還原那副年畫。

　　後來那副畫得了一等獎。那是我第一次感覺，畫畫好像沒那麼難。後來也斷斷續續地畫。那個時候最喜歡的就是畫花仙子。也是儘量地模仿書本上花仙子的樣子。所以臨摹一定是畫畫的第一步。當我們還不會自己構圖的時候，當我們對事物還沒有那麼深刻理解的時候，臨摹也許是最簡單最有效也最捷徑的方法了。

　　而對於書法來說，臨帖更是必不可少。臨帖是書法家終生的必修課。但臨帖一定要臨那些經典的作品。因為好的書法作品，一定能帶給你不一樣的啟發。你每次臨完之後一定會有不同的收穫。可是不好的作品同樣也會帶給你不好的影響。重複與模仿這種方法可行，是因為我們模仿的物件是值得學習的。如果一開始你模仿的物件就是一個偽物件，你不但會失去真正模仿的意義，也會把那些壞習慣學過來。

　　所以為什麼我們總愛說要樹立好的榜樣。因為壞榜樣一旦有人模仿，後果也是不堪設想。

　　最近看浙江衛視有檔歌唱類節目叫我是大歌神。裡面的選手就叫模唱選手。模唱選手和歌手本尊在挑戰間裡面唱，下面有猜評團的評委來猜哪個才是真正的歌手本尊。有那麼一些模唱歌手，真的能以假亂真，讓人分不清真偽。

　　所以主持人說雖然現在是模唱歌手，但將來也有可能找到自己的方向，成為真正的歌手。天后那英沒成名以前去參加歌唱比賽，也可以說是模唱。她當時模仿的是蘇芮。所以，在我們還沒有足夠的力量形成自己的風格以前，模仿也不失為一個好方法。我覺得這種方法最適合我這種音痴。

　　我一直唱歌都五音不全，老走調。有段時間覺得應該要好好改變一下，最好能一雪前恥。於是對著電腦一遍一遍地練習丁當的《我愛他》，後來有次去KTV，一個唱歌很好的朋友居然說這首唱得不錯，是練過的吧?嘿嘿，我會告訴你為了唱好這首歌我練了三個月?

　　同樣的，我覺得重複和模仿還適用於學習舞蹈。大家想想為什麼有那麼多人模仿MJ呢?那些舞蹈工作室的學員們，有哪個不是一遍遍地對著碟片認真練習那些經典的舞蹈?當你還沒有掌握基礎的舞蹈動作，沒有能力編舞的時候，那麼還是老老實實地從模仿和重複開始吧。

　　然後我想最適用這種方法的，應該要算某些體育運動了。這大概也是因為運動靠的就是肌肉啊，當然鍛鍊的也是肌肉。學乒乓球和羽毛球的同學都知道，教練教給你手的動作，然後就會讓你重複練習，增強肌肉記憶。而標準的握拍、揮拍、拉球等動作一旦習得，就一輩子都不會忘記。諸如鮑春來，王楠這樣的羽壇乒壇大咖，即使退役多年，參加某些綜藝節目的時候，人家一上手，分分鐘就知道什麼叫專業範。至於像體操跳水那些動作，哪個不是靠上千上萬次的練習來掌握的?

　　所以你看，重複和模模擬的是一條捷徑，能幫助你學習基礎，掌握技巧，提高技藝，然後才是形成自己的風格。也許很多時候不是我們學不會什麼，而是我們願不願意花點時間去重複與模仿。不要覺得重複與模仿可笑無聊低階。因為這是每一次學習的必經之路，是所有後天學習的基石。基礎打好了，要蓋高樓大廈那還不是遲早的事兒嗎?